Haruskah saya menggunakan "Raid 5 + cadangan" atau "Raid 6"?

12

Apa itu "Raid 5 + Spare" (kutipan dari User Manual, Sect 4.17.2, P.54 ):

RAID5 + Cadangan: RAID 5 + Cadangan adalah array RAID 5 di mana satu disk digunakan sebagai cadangan untuk membangun kembali sistem segera setelah disk gagal (Gbr. 79). Setidaknya diperlukan empat disk. Jika satu disk fisik gagal, data tetap tersedia karena dibaca dari blok paritas. Data dari disk yang gagal dibangun kembali ke disk cadangan panas. Ketika disk yang gagal diganti, penggantian menjadi cadangan panas baru. Tidak ada data yang hilang dalam kasus kegagalan disk tunggal, tetapi jika disk kedua gagal sebelum sistem dapat membangun kembali data ke cadangan panas, semua data dalam array akan hilang.


Apa itu "Raid 6" (kutipan dari User Manual, Sect 4.17.2, P.54 ):

RAID6: Dalam RAID 6, data dilucuti di semua disk (minimal empat) dan dua blok paritas untuk setiap blok data (p dan q pada Gambar. 80) ditulis pada strip yang sama. Jika satu disk fisik gagal, data dari disk yang gagal dapat dibangun kembali ke disk pengganti. Mode Raid ini dapat mendukung hingga dua kegagalan disk tanpa kehilangan data. RAID 6 menyediakan untuk membangun kembali data lebih cepat dari disk yang gagal.


Baik "Raid 5 + spare" dan "Raid 6" sangat mirip ... Saya tidak bisa membedakannya.

Kapan "Raid 5 + Spare" akan optimal?

Dan kapan "Raid 6" akan optimal "?

Manual ini membodohi berbagai serangan dengan peringkat bintang 5. "Raid 5 + Spare" hanya mendapat 4 bintang tetapi "Raid 6" mendapat 5 bintang. Jika saya mempercayai manual secara membabi buta, saya akan menyimpulkan bahwa "Serangan 6" selalu lebih baik. Apakah "Raid 6" selalu lebih baik?

Trevor Boyd Smith
sumber
1
ServerFault memiliki diskusi yang bagus tentang ini.
Brian
1
Apa pun yang Anda lakukan pada akhirnya, hanya menyerang dengan pengendali serangan, bukan dengan pengendali lunak on-board yang datang dengan mobo Anda. Jika mobo Anda padam, Anda meminta masalah.
sound2man
Serangan itu sedang turun oleh pengontrol perangkat keras (lol saya telah mendengar terlalu banyak hal terhadap pengontrol serangan perangkat lunak).
Trevor Boyd Smith

Jawaban:

17

Pendeknya:

  • Jika keselamatan adalah perhatian utama Anda, maka pergilah dengan RAID6 karena dapat bertahan dari dua drive yang gagal pada saat bersamaan. Jika drive gagal dalam pengaturan cadangan R5 + Anda tidak aman dari kegagalan lain sampai cadangan telah dinaikkan ke kecepatan yang bisa memakan waktu cukup lama dengan drive besar (dan itu tidak pernah terdengar untuk drive yang telah dimatikan untuk usia, seperti cadangan Anda, gagal berputar ketika akhirnya dipanggil).

  • Jika kinerja adalah raja, lanjutkan dengan cadangan 5+ karena kinerja penulisan akan lebih baik ketika array tidak dalam keadaan terdegradasi - meskipun perbedaan kinerja antara R5 dan R6 secara signifikan lebih kecil daripada perbedaan antara R5 dan solusi lain jika Anda memiliki controller yang baik (yaitu sekali yang membuat operasi penulisan blok parsial "dua / tiga bersamaan berbunyi kemudian paritas kalk kemudian dua / tiga bersamaan menulis" sebagian besar waktu daripada "baca-lalu-baca (-kemudian-baca) -kemudian paritas -calc-then-write-then-write (-then-write) "yang dapat dilakukan oleh beberapa pengontrol dan perangkat lunak RAID yang sangat murah.

Sunting: Saya melewatkan poin yang berpotensi penting pertama kali di sekitar:

  • Jika konsumsi daya menjadi perhatian, maka cadangan R5 + akan memiliki keuntungan tambahan jika pengontrol Anda membuat daya cadangan tetap rendah hingga dibutuhkan.
David Spillett
sumber
Paling baik ditulis / ringkas. (Nyatakan pro / kontra yang jelas dalam dua kata pertama dari setiap poin ... sangat baik).
Trevor Boyd Smith
Saya ingin tahu kapan, jika pernah, penarikan daya dari satu drive ekstra benar - benar akan menjadi "masalah" dibandingkan dengan segala sesuatu yang lain di pusat data / ruang server / dll
warren
Satu drive dalam satu mesin, mungkin tidak. Tetapi di colo di mana Anda mendapatkan X-amp-per-rak dan membayar banyak untuk kelebihan (atau kelebihan tidak diizinkan - kadang-kadang jika Anda pergi Anda menjadi gelap), itu bisa terlihat. Daya "dikonsumsi" juga merupakan kekuatan ganda: ia diubah menjadi suara dan panas dan Anda akhirnya membutuhkan lebih banyak daya untuk memindahkan panas. Dan untuk seluruh kandang atau set kit yang lebih besar, total penarikan drive tambahan per unit komputer segera menambah sesuatu yang mungkin diperhatikan oleh akuntan yang pemilih.
David Spillett
7

RAID 5 + cadangan panas:

  • pada kinerja perangkat keras pengontrol yang sama lebih baik daripada RAID 6
  • Anda tidak dapat kehilangan 2 disk secara bersamaan . ketika Anda kehilangan disk, ada waktu untuk membangun kembali (dengan cadangan panas) di mana Anda tidak memiliki redundansi . Apa pun yang gagal saat ini menciptakan kerugian total (kekurangan pengiriman segala sesuatu ke perusahaan penyelamat data yang baik dan membayar sangat mahal)

RAID 6:

  • kinerja lebih buruk daripada RAID 5 (ketergantungan pada pengontrol dapat berkisar dari sangat nyata hingga hampir tidak ada perbedaan)
  • Anda dapat kehilangan 2 disk secara bersamaan

Untuk setiap RAID 5 atau 6 Anda harus berhati-hati menggunakan disk yang bukan dari proses produksi yang sama. Itu bisa terjadi (saya sudah melihatnya!) Bahwa setelah satu kegagalan setelah membangun kembali disk berikutnya gagal karena meningkatnya stres. Disk dari proses yang sama memiliki firmware yang sama persis dan mungkin sifat fisiknya sangat mirip.

Edit: Apa yang harus dipilih

(Ini juga tergantung pada persyaratan kinerja server dan risiko yang dapat ditoleransi.)

Jika lingkungan server cukup bagus untuk perangkat keras (colo, climatized, dll.), Anda akan setuju dengan RAID5 + cadangan panas.

Jika lingkungan membuatnya lebih mungkin bahwa lebih dari satu disk gagal dalam waktu singkat (getaran, kelembaban, kotoran), maka gunakan RAID 6.

Selalu juga memiliki cadangan yang memadai dan uji pemulihan.

Sunting 2: Pengontrol RAID yang layak telah menggosok , yang memverifikasi semua sektor secara berkala.

rajutan
sumber
+1 untuk "memiliki cadangan yang memadai dan uji pemulihan". Itulah hal PERTAMA yang harus dimiliki setiap orang sebelum mereka mulai mengkhawatirkan tingkat RAID.
warren
3

RAID5 menggunakan satu strip paritas. Hal ini diperlukan untuk menghitung koreksi kesalahan Reed Solomon dan menulis dua garis untuk RAID6 vs satu untuk RAID5. RAID5 digunakan untuk aplikasi basis data yang intensif di mana penyimpanan sangat besar karena biaya RAID10. Biaya RAID5 bervariasi dari 67% hingga 94% ketersediaan disk di mana RAID10 adalah 50% (biaya penyimpanan jauh lebih tinggi) Sementara RAID6 memiliki latensi baca yang lebih rendah dengan jumlah yang sangat kecil karena latensi rotasi, RAID6 berada di antara 25 dan 31% lebih lambat dalam penulisan karena perhitungan koreksi kesalahan dan penulisan tambahan bit paritas.

Menggunakan mean time between failure (MTBF) untuk drive, probabilitas dua drive gagal satu demi satu atau pada saat yang sama adalah tentang (0.1% x 0.1%)*12atau 0.001 x 0.001 * 12; jika Anda memiliki 1000 drive yang berjalan maka Anda akan kehilangan rata-rata ~ 1,2 drive per tahun. Dua drive akan gagal satu tepat setelah yang lain sekitar setiap 8,3 tahun. Sekarang karena kegagalan drive bukan distribusi Poisson karena beban berat pada drive selama pembangunan kembali, kegagalan drive kedua lebih mungkin terjadi selama periode ini, dan distribusi lebih dekat ke distribusi Gamma dengan nilai yang sedikit lebih tinggi setelah kegagalan terjadi.

Intinya adalah, kinerja untuk RAID5 lebih baik dari pada RAID6 pada menulis dan untuk aplikasi DB - jauh lebih baik. Untuk aplikasi yang kebanyakan dibaca seperti server web, tidak ada bedanya dan Anda harus menggunakan RAID6. Manfaat biaya menggunakan RAID5 lebih dari RAID10 sangat besar untuk penyimpanan besar. Jika Anda mampu membeli overhead, gunakan RAID10 untuk aplikasi yang sangat intensif disk. RAID10 akan selalu berkinerja lebih baik.

Intinya terbesar yang terlewatkan adalah RAID BUKAN cadangan, tetapi cara untuk membatasi downtime dengan menyediakan redundansi. Jika data sangat penting, Anda harus mencadangkannya (dan menguji proses pemulihan Anda).

Jika satu RAID array 10 drive SAS 2TB gagal, pemulihan akan menelan biaya ribuan dolar dan membutuhkan waktu berminggu-minggu untuk pulih, jika itu bahkan dapat dilakukan.

Semua array RAID akhirnya gagal!

Bombilious
sumber
1

Berbicara secara ketat dari sudut pandang integritas data, ya. Anda dapat dengan aman kehilangan dua drive, meskipun itu adalah kejadian langka kehilangan dua bersama-sama pendek dari trauma fisik yang berat ke sistem.

Secara finansial, tidak sebanyak itu. Suku cadang yang panas dapat dimatikan sampai dibutuhkan, yang berarti tidak menggunakan daya dan tidak menyebabkan keausan.

Dan seperti biasa, RAID bukan pengganti untuk rencana cadangan luar-situs yang tepat.

Ignacio Vazquez-Abrams
sumber
1

Sudahkah Anda mempertimbangkan 10? Jika Anda memiliki cukup disk untuk serangan 6, Anda punya cukup untuk melakukan 10 volume. Dalam kebanyakan kasus 10 lebih cepat dan lebih redundan (dengan biaya beberapa ruang disk).

Joel Coehoorn
sumber
10 hanya mendukung 4 disk. jadi raid 10 bukan merupakan opsi IMO.
Trevor Boyd Smith
1
@Trevor Raid 10 mendukung sejumlah disk>> 4. Jika Anda dapat melakukan serangan 6, Anda dapat melakukan serangan 10.
Joel Coehoorn
1

Jawaban ini tampaknya tidak benar karena HANYA didasarkan pada kinerja drive teoretis. Pertimbangkan, jika Anda memiliki pengontrol RAID dengan 1 GB cache, maka penulisan (biasanya di bawah beban normal - bukan skenario beban tinggi non-normal besar-besaran) langsung dari perspektif pengguna atau aplikasi - ia pergi ke memori dan kemudian tulisan 'aktual' terjadi pada kinerja drive.

Namun, membaca tidak dapat 'dipalsukan' (dipercepat dengan cache) kecuali data yang sama baru-baru ini atau biasanya sudah dimuat. Raid 6 lebih baik untuk dibaca dan lebih toleran (2 berbanding satu drive). Raid 5 lebih lambat menulis dan sangat lambat saat membangun kembali.

Jadi, sementara RAID 5 akan lambat dalam penulisan yang sebenarnya, itu akan disembunyikan dengan pengontrol serangan yang baik - di mana penulisan terjadi dalam memori dari perspektif pengguna / aplikasi. Namun, Raid 5 adalah pembacaan yang lebih lambat daripada raid 6 dan itu tidak akan ditingkatkan dengan pengontrol kecuali data telah dimuat atau suatu algoritma menyimpan catatan pembacaan berulang. Dalam kehidupan nyata - serangan 6 menang.

Sebagai kesimpulan, penulisan Raid 5 lambat tetapi disembunyikan dengan pengontrol yang baik dan yang membuat serangan 5 atau 6 pada dasarnya sama dengan kinerja 'persepsi' dalam penulisan (ada beberapa pengecualian). Namun, Raid 6 membaca lebih cepat dan pengontrol kemungkinan tidak akan membantu dalam beban kerja kehidupan nyata untuk meningkatkan kinerja membaca. Sekarang tambahkan bahwa Raid 6 dapat mengambil dua kegagalan dan Raid 5 + 1 hanya satu itu mudah untuk memilih Raid 6 sebagai pilihan yang lebih baik: jangan lupa membangun kembali pada Raid 5 juga sangat lambat. Saya juga telah belajar bahwa drive Raid 6 digunakan (dengan demikian diuji dengan cara yang benar) dan drive yang gagal cenderung gagal dengan sangat cepat. Setelah array naik lebih dari 30 hari, cenderung bertahan selama bertahun-tahun. Sebuah cadangan panas belum teruji dan mungkin benar-benar gagal segera saat dibutuhkan.

Trevor
sumber
0

Ini adalah fakta-fakta dari kasus ini, dan mereka tidak perlu dipersoalkan (oleh siapa pun yang tahu apa yang mereka bicarakan):

  1. RAID5 + hotspare, secara harfiah, adalah pilihan RAID terburuk yang dapat Anda pilih.
  2. RAID10 harus menjadi pilihan default jika Anda peduli dengan data Anda (artinya Anda bergantung padanya, misalnya, agar bisnis Anda tetap berjalan).

Jika Anda mempertimbangkan semua opsi RAID yang memungkinkan, tidak ada kasus di mana RAID5 + hotspare adalah pilihan terbaik, terutama karena jika Anda memiliki RAID5 + hotspare, berarti Anda memiliki 4 drive, dan dengan 4 drive Anda dapat melakukan RAID6, atau bahkan lebih baik, Anda bisa melakukan RAID10.

Dengan 4 drive Anda mendapatkan penyimpanan yang dapat digunakan yang sama dari semua pilihan (R5 + HS, R6, R10).

Jika sasaran Anda adalah kinerja, maka RAID10 akan lebih unggul dari RAID5 dan RAID6.

Jika tujuan Anda aman, RAID6 atau RAID10 lebih unggul dari RAID5 dengan atau tanpa hotspare. Masih bisa diperdebatkan mana yang lebih aman (6 vs 10). RAID6 dapat mengalami 2 kegagalan drive, tetapi karena kesalahan baca yang tidak dapat dipulihkan (URE), ada kemungkinan juga bahwa satu kegagalan drive dalam RAID6 akan membunuh seluruh array.

RAID10, karena tidak berbasis paritas, tidak memiliki masalah yang sama dengan URE. Jika paritas RAID (R5, dll) kehilangan drive, dan kemudian menemukan URE, seluruh array akan hilang. Dengan RAID1 atau RAID10, jika drive hilang, dan kemudian URE ditemukan pada disk cermin, hanya sektor yang tidak dapat dibaca yang hilang.

Lihat di sini untuk penjelasan terperinci tentang mengapa RAID5 adalah pilihan yang paling buruk . Lihat juga di sini untuk daftar pilihan RAID yang masuk akal berdasarkan jumlah drive . Perhatikan bahwa RAID5 bukanlah pilihan terbaik (terlepas dari hotspare).

pengguna1594322
sumber
2
Saya tidak setuju. RAID5 memiliki kegunaannya. (mis. ketika anggaran ketat dan Anda benar-benar membutuhkan ruang disk). Dan karena RAID tidak menggantikan cadangan yang masih hidup, satu kegagalan disk cukup untuk membuat Anda kelebihan hingga jam 5 sore, pada saat itu orang-orang meninggalkan kantor dan Anda melakukan pemeliharaan darurat.
Hennes
Ada perbedaan antara "pilihan terbaik" dan "pilihan terbaik yang Anda mampu". RAID5 tidak pernah menjadi pilihan terbaik. Orang-orang datang ke sini untuk mendapatkan jawaban terbaik, dan orang-orang harus pergi dari sini mengetahui bahwa RAID5 selalu kurang dari yang terbaik. Secara matematis dapat dibuktikan bahwa dalam beberapa kasus RAID0 lebih dapat diandalkan daripada RAID5. Itulah cara RAID5 menakutkan. Dalam banyak kasus, RAID5 mungkin tidak mencapai jam 5 sore. Ada perbedaan besar antara teori dan dunia nyata ketika datang ke RAID5. Lihat di sini
user1594322
Sama sekali tidak jelas bagi saya mengapa Anda mengatakan bahwa RAID10 tidak memiliki masalah yang sama dengan URE. Dengan setup RAID10 empat drive, jika Anda kehilangan satu drive dan menderita URE pada mirror yang sesuai, Anda sama-sama disemprot.
ChrisInEdmonton
Jika RAID10 memiliki drive yang gagal, dan kemudian memiliki URE pada drive yang bertahan, Anda hanya kehilangan sektor yang tidak dapat dibaca, bukan seluruh array. Diperbarui jawabannya.
user1594322