Mana yang lebih baik: RAID5 + 1 Hotspare / RAID6? [Tutup]

45

Hanya ingin tahu, saya punya 6 x 1TB 7200RPM Near Line SAS untuk server baru saya. Saya dapat mengkonfigurasinya sebagai RAID5 + 1 Hot Spare atau RAID6.

Apa yang harus saya pilih?

Raptor
sumber
1
Saya berspekulasi bahwa 5 tahun dari sekarang ... banyak orang akan bertanya .. apa RAID? Ini akan menuju keluar pintu segera tetapi masih relevan untuk hari ini.
Matt
1
Jadi karena banyak orang yang menyatakan pendapat alih-alih fakta, kami menutup topik dan tidak membiarkan fakta-fakta itu didiskusikan? Sepertinya itu salah. Ada matematika yang menunjukkan mengapa RAID 6 lebih baik untuk keselamatan, kapasitas dan bagaimana kecepatan dipengaruhi. Tidak ada opini yang terlibat.
Scott Alan Miller

Jawaban:

36

Anda memiliki kekurangan dan kelebihan dengan masing-masing pendekatan; itu tergantung pada mengapa Anda menggunakan RAID. Kebanyakan orang menggunakannya untuk ketersediaan. Mereka tidak ingin drive mati dan akhirnya harus menurunkan sistem atau server mereka. Dalam hal itu, Anda tidak menggunakan RAID 5. Saya mempelajarinya dengan cara yang sulit dan palu poin ini pulang dengan setiap pertanyaan terkait RAID yang saya bahas di SF.

Mengapa? Karena ketika drive semakin besar, ada lebih banyak toleransi untuk URE, kesalahan baca yang tidak dapat dipulihkan. Kami telah terjadi dan itu bukan apa yang ingin Anda temukan di tengah pembangunan kembali. Skenario: Sistem RAID dengan 3 drive. Kami mendapat alarm pada Dell kami dengan kartu PERC perangkat keras yang mendorong C mati. Pesan drive baru, tukar, tidak masalah. Di tengah pembangunan kembali, ia meninggal.

Menurut diagnostik, ada "titik buruk" pada drive B. Sistem ini gagal berulang kali pada drive itu, dan sekarang setelah membangun kembali data, tidak dapat membaca tempat itu, dan tidak peduli berapa kali kami menjalankan perbaikan bahkan dari controller langsung dan setiap kali mengatakan semuanya sudah diperbaiki, itu tidak akan dibangun kembali. Jadi kami memiliki satu drive mati dan satu drive yang tidak dapat membaca dari satu tempat ... kami akhirnya mengganti 2 drive dan memulihkan dari cadangan.

Pelajaran: RAID bukan cadangan, dan RAID 5 tidak lagi menjadi opsi ketersediaan untuk drive yang lebih besar.

Jika Anda ingin meningkatkan kecepatan atau menambah ukuran penyimpanan, maka Anda dapat menyeimbangkannya dalam keputusan Anda. Anda perlu mendefinisikan kebutuhan Anda dalam hal kebutuhan dan tujuan Anda, bukan dalam hal "Saya perlu RAID, yang mana yang saya gunakan?"

Bart Silverstrim
sumber
1
Drive yang dimaksudkan untuk operasi RAID biasanya gagal koreksi kesalahan mereka dengan sangat cepat dan melaporkan kegagalan tersebut ke controller. Idenya adalah untuk menghindari situasi seperti yang Anda jelaskan di atas - blok buruk akan dipetakan ulang dan data pulih dari paritas daripada disk yang ditandai sebagai buruk karena "hang" selama 45 detik mencoba untuk memulihkan blok itu. Digital Barat bahkan memiliki utilitas untuk mengubah perilaku pemulihan kesalahan disk mereka, meskipun utilitas tersebut tidak "secara resmi" dirilis.
chris
7
Saya tidak bisa mengikuti argumen. Apakah Anda mengatakan menggunakan RAID 6, atau RAID 5?
Martin
@martin: Saya mengomentari kekhawatiran bahwa jenis kegagalan disk tertentu ditangani secara berbeda tergantung pada desain target disk itu sendiri. Martin menggambarkan kegagalan multi-disk sebagai akibat dari "titik buruk" pada disk, yang dalam beberapa situasi tidak akan (dan tidak seharusnya) menyebabkan array penuh dibangun kembali. Dalam proses pembentukan kembali array, disk lain gagal, mengakibatkan hari yang buruk.
chris
@ Chris - Maaf atas kebingungan - Saya tidak mengomentari komentar Anda. (Itu tidak ada di sana ketika saya memposting.) Pertanyaan saya diarahkan pada Bart: Saya tidak bisa mencari tahu apakah dia mengatakan RAID 5 adalah must-have, atau apakah RAID-5 tidak cukup dan hanya RAID 6 yang akan melakukannya.
Martin
2
@ Chris-Saya tidak tahu lagi apa bedanya, tetapi PERCs berbasis perangkat keras, cache onboard, alat manajemen terintegrasi, hot swap, dll. Dan sementara Dell tidak selalu mengenakan biaya sepuluh ribu untuk server mereka cukup populer di lingkungan perusahaan. Drive seharusnya melaporkan kesalahan; itulah cara Anda mendapatkan pesan dan peringatan kesalahan. Tetapi URE adalah sesuatu yang terjadi pada drive dan mereka tampaknya tidak menyadarinya sampai melakukan sesuatu seperti ... oh ... membangun kembali sebuah array. Lalu tiba-tiba, "Hei! Ada masalah di sini juga!"
Bart Silverstrim
16

Gunakan RAID6. Baca "Mengapa RAID 6 berhenti bekerja di 2019" oleh Robin Harris di ZDNet.

merobek-
sumber
4
Dan bagaimana setelah 2019?
Mat
2
@Mat Hai dari tahun di mana RAID 6 berhenti bekerja. ;-) Ini benar-benar seharusnya ada di artikel, tetapi Anda harus melihat ke dalam penghapusan kode , biasanya diimplementasikan dengan polinomial oversampling atas GF (256) . Ini berarti (hampir) tingkat redundansi sewenang-wenang dapat digunakan, misalnya 9 + 3 atau 12 + 4. Kerugian utama adalah bahwa itu sedikit lebih mahal secara komputasi daripada paritas RAID 6 atau bahkan RAID 5.
Arne Vogel
9

RAID 5 seharusnya tidak pernah ada dengan cadangan panas (cadangan hangat.) RAID 6 selalu lebih baik menggunakan jumlah drive yang sama.

http://www.smbitjournal.com/2012/07/hot-spare-or-a-hot-mess/

Tidak ada keunggulan ruang / kapasitas atau keunggulan biaya untuk solusi RAID 5 (tetapi beberapa keunggulan kinerja kecil) tetapi tidak ada satu ton untuk mengurangi hal-hal seperti risiko URE.

Scott Alan Miller
sumber
3
RAID-6 jauh lebih lambat dari pada RAID-5 + cadangan panas. RAID-6 tidak selalu lebih baik.
Stefan Lasiewski
2
RAID-5 (atau dalam hal ini RAID-6) dengan cadangan dapat masuk akal dari perspektif jumlah drive jika Anda memiliki lebih dari satu strip yang dapat berbagi satu cadangan. Itu memungkinkan resilver untuk memulai segera ketika drive gagal, dan mengganti drive yang gagal ASAP tetapi ketika nyaman , bukannya berebut untuk mengganti drive yang gagal sebelum ada kegagalan lain.
CVn
2
RAID 6 lebih cepat saat dibaca, lebih lambat saat menulis. Namun hanya saat acak. Secara berurutan, lebih cepat pada keduanya. Tetapi perbedaan keamanannya epik, urutan penuh perbedaan besarnya. Tambahkan cache tulis seperti yang dimiliki RAID perangkat keras kelas bisnis dan penulisan acak RAID 6 turun drastis. Sangat jarang R6 lebih lambat dari R5 karena memiliki spindle ekstra.
Scott Alan Miller
Resilving langsung sebenarnya adalah bahaya karena ini adalah operasi resilver yang menempatkan array dalam bahaya paling besar. R6 dengan cadangan panas sama sekali berbeda dari R5 dengan cadangan panas. R5 dengan cadangan panas tidak boleh ada karena Anda menggunakan drive yang sama di R6 tetapi mendapatkan kecepatan dan keandalan. Tidak perlu resilver, perlindungan sudah ada tanpa risiko URE dari operasi resilver.
Scott Alan Miller
6

Yang ini mudah - Anda ingin lebih banyak ruang disk yang tersedia atau kemampuan untuk bertahan dari kegagalan disk - sesederhana itu.

Jadi saya akan membuat beberapa asumsi liar - bahwa Anda tidak peduli tentang kinerja karena mereka 7.2 's dan bahwa Anda peduli tentang ruang yang tersedia karena mereka disk 1TB - Anda tidak menyebutkan jenis data yang Anda inginkan untuk menyimpan tetapi saya akan menganggap itu hanya file video atau kombinasi video dan audio. Jika saya benar maka mungkin Anda akan berjuang untuk mengganti data? dalam hal ini saya akan memilih tidak 5 atau 6 tetapi pergi dengan R10, ya Anda kehilangan 1TB lebih dari R6 dan 2TB lebih dari R5 tetapi itu akan lebih cepat dan dapat bertahan tiga disk akan pop. Jika saya salah dan Anda dapat dengan cepat memulihkan data Anda maka Anda juga bisa pergi R5 sehingga Anda mendapatkan ruang paling tersedia.

Chopper3
sumber
1
“Ya, Anda kehilangan 1TB dari R6 dan 2TB dari R5 tetapi itu akan lebih cepat dan dapat bertahan tiga disk pop.” - Itu jika Anda beruntung; dalam kasus terburuk Anda tidak akan bertahan lebih dari 1 kegagalan drive (jika yang ke-2 berada di pasangan RAID 1 yang sama dengan yang pertama). Jika saya tidak salah, untuk kegagalan drive 1, 2, 3, dan 4, probabilitas kumulatif 'naif' untuk menggunakan cadangan adalah masing-masing 0, 1/5, 3/5, 1 (jumlah nol istilahnya adalah jumlah kegagalan drive yang dapat ditoleransi dengan aman). Dengan RAID 6, 0, 0, 1, yang agak lebih mudah untuk dikerjakan, ditambah Anda tidak kehilangan terabyte tambahan itu.
James Haigh
2
Anda benar James, semuanya telah berubah dalam LIMA TAHUN terakhir (OMG yang sudah lama sekali - wow!) Dan sekarang saya hanya merekomendasikan R6 / 60 dan R1 / 10.
Chopper3
4

Meskipun kinerja adalah masalah, itu bukan masalah seperti yang Anda pikirkan. Perangkat keras RAID yang lebih baru akan lebih cepat menulis 2 garis paritas seperti pada 1 garis.

Selain itu, drive SAS biasanya memiliki Bit Error Rate yang lebih rendah, yang diterjemahkan menjadi Unrecoverable Read Error (URE) yang lebih rendah. Biasanya urutan besarnya (10x), namun, jika drive SAS adalah model yang sama dengan drive SATA, Anda mungkin tidak melihat peningkatan.

Akhirnya, tentang pertanyaan RAID-5 dan URE dan bagaimana hal itu dapat merusak hari Anda, saya menulis sebuah artikel tentang itu beberapa waktu yang lalu di: http://subnetmask255x4.wordpress.com/2008/10/28/sata- unrecoverable-errors-and-how-that-impact-raid / di mana saya membahas beberapa pertanyaan ini. Pada dasarnya, RAID-6 pada perangkat keras yang baik (bukan perangkat lunak RAID) harus menunjukkan kinerja yang setara dengan RAID-5. Jika Anda memiliki perangkat keras yang buruk, atau menggunakan perangkat lunak RAID, maka Anda akan melihat hit kinerja.

Seperti biasa, cadangan adalah anugerah hemat Anda. Jangan lupa untuk menerapkan kebijakan cadangan, DAN verifikasi bahwa kebijakan itu dapat dipulihkan.


sumber
2
Wow, kupikir aku ada di mana-mana dengan yang itu. Apa yang saya coba katakan adalah bahwa mengingat drive Anda, jika Anda memiliki pengontrol RAID perangkat keras yang baik, maka RAID 6 tidak memiliki kerugian atas RAID 5 dengan cadangan panas (+1). Namun, jika Anda tidak memiliki perangkat keras RAID controller yang baik, maka Anda akan melihat lebih lambat membaca dan menulis, dengan menulis menjadi sedikit lebih lambat daripada membaca. Jika Anda menggunakan perangkat lunak RAID saja, maka Anda akan melihat lebih lambat dibaca, dan banyak menulis lebih lambat. Perangkat keras yang bagus - RAID 6; Perangkat keras yang buruk - RAID 6 dengan performa hebat; Hanya perangkat lunak - RAID 5 (+1) dan banyak berdoa.
3

Banyak saran bagus di sini, terutama dari Bart dan Chopper3.

Satu-satunya hal yang akan saya tambahkan adalah menguji beban kerja Anda dalam kondisi gagal. Orang-orang biasanya mengatur RAID-5 / RAID-6 untuk membeli ketersediaan (mis. Server tidak turun karena kegagalan disk). Sayangnya, untuk beberapa beban kerja - terutama beban kerja tulis-berat, Anda mungkin mendapati bahwa performa yang cukup parah sehingga Anda tidak membeli banyak.

Jika pengujian Anda berhasil, bagus - jangan lupa untuk merencanakan dan menguji strategi cadangan.

duffbeer703
sumber
2

Saya pikir RAID 5 vs. 6 (dan vs. 10) menunjukkan kinerja dan seberapa besar Anda mempercayai merek drive yang Anda gunakan. Kami terutama menggunakan server HP dan penyimpanan HP dan memiliki sedikit kegagalan disk, jadi saya senang dengan RAID5 + hotspare atau bahkan hanya RAID5 pada sistem yang kurang kritis.

Secara teori, RAID6 menyelamatkan Anda dari kegagalan drive kedua saat drive gagal pertama sedang dibangun kembali, tetapi Anda menukarnya dengan peningkatan perhitungan yang diperlukan untuk menghasilkan 2 garis paritas berbeda. Kami belum menggunakan 6, jadi saya belum pernah melihat spesifikasi seberapa cepat array RAID6 dapat dibangun kembali vs RAID5, tapi saya berasumsi 6 akan lebih lama karena harus melakukan 2 perhitungan paritas, bukan hanya satu.

Jika saya akan pindah dari RAID5, saya mungkin akan pergi dengan 10 (atau 01) untuk menjauh dari perhitungan paritas sama sekali. Dengan 6 drive, Anda bisa melakukan itu, meskipun Anda hanya mendapatkan setengah dari kapasitas.

Bangsal
sumber
2

RAID6. Dengan begitu, jika dua disk gagal secara berurutan relatif cepat, maka array belum selesai membangun kembali dari kegagalan pertama (atau 2 disk gagal berputar setelah pemadaman listrik), Anda tidak kehilangan semua data Anda.

xenny
sumber
1

Raid6 memiliki lebih banyak overhead, sehingga raid5 akan lebih cepat pada jumlah drive yang sama. Di sisi lain Anda mungkin kehilangan keuntungan setelah disk mati, dan rai5 membangun kembali, Anda berisiko kehilangan array jika drive lain mati selama pembangunan kembali.

Dalam kasus Anda, Anda menjalankan raid5 vs 6 pada jumlah spindel yang berbeda, jadi karena serangan spindle ekstra6 mungkin lebih cepat.

dyasny
sumber
1

Jawaban yang bagus, kecuali tidak ada yang menyebutkan kinerja penulisan. RAID 6 biasanya membuat Anda sedikit kinerja yang menulis dibandingkan dengan RAID 5, karena ada dua garis paritas yang harus dipertahankan.

Meskipun demikian, sebagian besar merasa berharga untuk menggunakan RAID 6.

kmarsh
sumber