Raid1, tiga drive lebih banyak, solusi untuk pengaturan multi-terrabyte di bisnis kecil?

0

Dengan rasio ruang terhadap biaya dari hard drive yang mengarah ke kapasitas yang menghadirkan tantangan yang meningkat terhadap sistem Raid paritas (probabilitas URE, pembangunan kembali multi-hari yang menekankan pada drive dan mempertaruhkan kegagalan sekunder) apakah ada kasus yang dibuat bahwa mereka juga memberikan peluang / rekomendasi untuk multi-disk (> 2) Konfigurasi serangan 1 untuk digunakan di rumah dan di usaha kecil? Artinya, ruang RAID1 'limbah' dibandingkan dengan skema paritas, tetapi dengan murah mutli-terabyte drive, ruang tidak bisa dibilang komoditas kita harus untuk buang dibandingkan dengan memori, bandwidth, jam cpu, downtime dll diperlukan dalam striping, membangun kembali dll .

Jika saya memahami teknologi dengan benar, konfigurasi Raid 1 (> 2):

  • ..tidak dapat gagal membangun kembali, selama satu drive dapat diakses, begitu pula file-nya.
  • ..menyediakan keamanan yang lebih besar relatif terhadap jumlah drive. Ini pada dasarnya adalah inversi dari rasio bukan? Raid5 pada tiga disk memberikan kapasitas yang dapat digunakan 66% dan dapat menangani kegagalan 33% (1 drive). Raid1 hanya menyediakan kapasitas 33% tetapi kegagalan 66% (2 drive).
  • ..memiliki mekanisme pemulihan yang lebih mudah dan lebih kuat. Dalam kondisi yang mengerikan, Raid tidak perlu dibangun kembali untuk mengakses data. Drive dapat dimigrasikan di antara sistem yang berbeda.

Poin terakhir itu terasa mirip dengan filosofi UnRaid di mana file disimpan di drive, dan tidak bergaris, dan poin kedua menunjukkan kepada saya sesuatu yang lebih menarik bagi bisnis kecil; memprioritaskan keamanan data daripada kapasitas data. Apa gunanya menyimpan lebih banyak data jika berisiko lebih besar?

Pertanyaan:

  1. Apakah strategi 'mirroring secara manual' konten, sebagai lawan Raid1 menyalin-pada-saat-penulisan, menghindari potensi masalah dengan korupsi memori non-ECC? Karena pekerjaan menulis ke setiap disk akan menjadi proses yang berbeda kesalahan memori yang sama yang terjadi dalam satu penulisan tidak akan secara teoritis terjadi pada yang lain?

  2. Apakah ada perangkat lunak / perangkat keras Raid1 yang dirancang untuk bekerja dengan lebih dari dua drive, dan karena itu dapat menangani perilaku seperti un-raid1 tradisional seperti bit-rot, URE dll? Dengan pengaturan mirror disk tradisional jika disk A melaporkan 0 dan B melaporkan 1, Anda tidak tahu siapa yang membalik, tetapi dalam tiga atau lebih solusi disk tidak bisakah Anda tidak 'memperbaiki' disk aneh yang keluar? A = 0, B = 1, C = 0 sehingga B pasti terbalik?

  3. Pada saat yang sama, apakah solusi Raid1 akan mendukung pembacaan paralel dari lebih dari dua disk untuk memberikan kecepatan baca yang dipercepat? Ini sangat penting karena saya membayangkan ada banyak bisnis yang membaca data yang sama lebih banyak daripada mengeditnya.

  4. Raid bukan solusi cadangan. Jadi jika Anda mengikuti praktik yang baik dan memiliki antara 2-3 lokasi penyimpanan, apakah ini dimaksudkan bahwa hanya satu dari mereka yang terlindung dari kegagalan drive melalui skema raid atau apakah Anda mengharapkan lokasi di luar kantor kedua juga memiliki redundansi multidisk? Apakah ini kasus bahwa bahkan satu drive, yang disimpan di lokasi yang berbeda dianggap dilindungi dari kegagalan perangkat karena itu berada dalam hubungan cermin yang 'efektif' dengan drive di lokasi lain? Jika tidak, maka apakah Raid1 tidak menawarkan redudansi untuk jumlah drive minimum terendah (2)?

Memperbarui:

Poin 1, seperti yang ditunjukkan beberapa orang, ini memang bergantung pada sumber data yang bebas dari kesalahan. Namun ini adalah kasus untuk hampir semua strategi penyimpanan / cadangan. Kami dapat menggunakan sistem canggih untuk integritas data dalam solusi NAS / SAN kami, tetapi data yang kami simpan di dalamnya biasanya dihasilkan oleh stasiun kerja dan perangkat tanpa tindakan seperti itu. Sebagian besar PC produksi dibuat untuk biaya atau kecepatan. Sangat tidak mungkin, terutama dalam bisnis kecil, bahwa komputer yang Anda gunakan CAD atau keuangan atau powerpoint Anda dll menggunakan drive ZFS yang diformat dan memori ECC.

Dalam contoh spesifik saya, salah satu hal yang ingin saya simpan adalah output dari kamera. Saya harus mengasumsikan foto dan video yang disimpannya ke kartu SD adalah 'benar', dan tidak banyak yang bisa saya lakukan jika korupsi terjadi pada titik dalam rantai data.

Saran:

Jika strategi ini tidak didukung pada level RAID, adakah paket perangkat lunak yang dapat digunakan untuk melakukan beberapa aktivitas yang saya bicarakan secara manual? Menulis salinan melalui tugas rysnc yang terpisah dan terpisah? Script bash dapat melakukan scr-bit-rot secara berkala? Hanya checksum semua salinan file tertentu di semua disk, lalu timpa salinan pada disk dengan checksum yang salah menggunakan salinan pada disk yang benar?

John S.
sumber
Saya mungkin kehilangan poin / maksud dari sub-pertanyaan Anda # 1. Jika kerusakan data terjadi ketika Anda menulis ke disk utama (pertama) Anda, dan kemudian Anda menyalin file ke disk kedua, bukankah itu akan menyalin data korup yang ditulis ke disk pertama?
Scott
1
Bahwa ada banyak pertanyaan .... Lihat superuser.com/questions/489793/... untuk kemungkinan duplikat ....
Pimp Juice IT
RAID 6 juga menyediakan 2 drive gagal. Overhead RAID 5 bernilai +1, dan RAID 6 bernilai +2, sehingga biaya overhead turun saat Anda menambah jumlah drive. Karena jumlah total drive tambahan tetap sama.
cybernard
Jika Anda daisy dirantai menulis Anda, Anda akan benar. Jadi tulis dari sumber ke disk 1, maka disk 1 ke disk 2 dll akan melanggengkan kesalahan. Namun jika Anda membaca dan menulis ke setiap disk dari sumber secara terpisah, Anda mungkin menghindari masalah ini? Jelas sumber yang menyimpan data asli, harus benar.
John S.
Permintaan maaf untuk banyak pertanyaan. Ada beberapa topik di sini yang berpotensi rangkap tetapi tidak ada yang saya lihat yang membahas pertanyaan-pertanyaan khusus ini. Yang terbaik yang saya kumpulkan adalah tidak ada yang sejauh ini dapat menyebutkan pengontrol perangkat keras yang menyediakan fungsionalitas ini dan bahwa mdadm Linux menangani Raid1 dengan lebih dari dua drive tetapi tidak menawarkan fungsionalitas tambahan ketika berhadapan dengan konfigurasi> 2.
John S.

Jawaban:

0

Untuk menjawab pertanyaan

  1. Mencerminkan konten secara manual akan memintas beberapa masalah potensial yang terkait dengan ECC, tetapi dapat memperkenalkan masalah lainnya. Ini juga mengasumsikan data sumber tidak rusak oleh kegagalan sebelumnya.

  2. Ini tergantung pada perangkat keras / lunaknya. Saya membayangkan sebagian besar implementasi RAID1 tidak akan mengambil bitrot, tetapi akan menangani URE. Pembacaan sepotong data umumnya hanya dilakukan dari 1 drive, tidak semua - yang akan memungkinkan untuk membaca lebih cepat secara keseluruhan.

  3. Jika RAID1 mendukung semua 3 disk, ya, pembacaan paralel akan lebih cepat dengan lebih banyak disk. AFAIK ini tidak didukung dalam mdadm (yaitu solusi berbasis raid perangkat lunak Linux) karena drive ke-3 diperlakukan sebagai cadangan panas.

  4. Apakah Anda mengacaukan lokasi di luar kantor Anda adalah pertanyaan tentang ketahanan dan keandalan. Ini akan menjadi praktik terbaik, tetapi bukan keharusan mutlak. Dalam pikiran saya hard disk adalah bagian yang dapat dikonsumsi - memiliki RAID memungkinkan untuk penggantian kegagalan tanpa harus membangun kembali DAN meningkatkan daya tahan. Ini benar-benar akan menjadi diskusi biaya-manfaat.

davidgo
sumber
Sebuah pemikiran (tetapi bukan jawaban) - Sudahkah Anda mempertimbangkan teknologi alternatif untuk RAID? ZFS (bagus untuk snapshot / pitr dan replikasi di luar lokasi), MooseFS atau yang serupa harus memungkinkan batu bata dengan redundansi terdistribusi tetapi lebih sedikit perangkat keras, bahkan LVM dapat menyediakan mirroring - digunakan bersama dengan MDADM yang dapat memberikan solusi tipe RAID1 lebih dari 3 disk.
davidgo
Terima kasih atas jawaban yang komprehensif. Bisakah Anda menguraikan jenis masalah apa yang bisa diperkenalkan dengan mirroring manual, dan bagaimana Anda membayangkan menangani URE akan terjadi? Sesederhana pengontrol akan berusaha membaca dari satu disk dan secara otomatis memindahkan bacaan ke yang lain jika menemui URE?
John S.
Anda benar bahwa di ZFS vdev yang dicerminkan mendukung pengaturan checksumming dan beberapa disk ( zfsbuild.com/2010/05/26/zfs-raid-levels ). Akan menarik untuk mengetahui apakah pengaturan ini memiliki overhead yang lebih rendah (ZFS sangat intensif RAM) daripada pengaturan RaidZ, RaidZ2 dan RaidZ3 yang jauh lebih umum.
John S.
0

Mari kita mulai dengan asumsi:

Jika saya memahami teknologi dengan benar, konfigurasi Raid 1 (> 2):

..tidak dapat gagal membangun kembali, selama satu drive dapat diakses, begitu pula file-nya.

Ini benar, tetapi itu tidak melindungi dari sambaran petir, pencurian, banjir dll. Dengan demikian, sementara Anda mengurangi satu risiko, Anda masih memerlukan cadangan di luar lokasi.

..menyediakan keamanan yang lebih besar relatif terhadap jumlah drive. Ini pada dasarnya adalah inversi dari rasio bukan? RAID5 pada tiga disk memberikan kapasitas yang dapat digunakan 66% dan dapat menangani 33% (1 drive) kegagalan. Raid1 hanya menyediakan kapasitas 33% tetapi kegagalan 66% (2 drive).

Itu mengasumsikan bahwa kegagalan drive independen. Pada SAS, ini mungkin terjadi (kecuali drive gagal spektakuler dan juga merusak drive lain), tetapi tidak demikian halnya dengan PATA atau SATA. Biasanya disk yang digantung berarti semua drive pada pengontrol itu akan hang. Anda masih akan memiliki data tetapi Anda juga akan memiliki waktu henti.

..memiliki mekanisme pemulihan yang lebih mudah dan lebih kuat. Dalam kondisi yang mengerikan, RAID tidak perlu dibangun kembali untuk mengakses data.

Sebagian besar waktu pembangunan kembali tidak menjadi masalah. Tidak ada yang membangun kembali array RAID. Dengan disk terabyte, lebih cepat untuk mengganti disk, membuat ulang array dengan data Anda dan memulihkan dari cadangan.

Dari perspektif bisnis, tujuan rata-rata dari RAID adalah menjaga agar sistem tetap berjalan hingga pukul 17:00, lalu pastikan cadangan harian Anda berfungsi, diikuti oleh disk baru, array RAID baru, dan pemulihan dari cadangan.

Drive dapat dimigrasikan di antara sistem yang berbeda

Ini tergantung banyak implementasi RAID. Mungkin berhasil. Mungkin tidak.


Apakah strategi 'mirroring secara manual' konten, sebagai lawan dari menyalin RAID1 pada saat penulisan, menghindari potensi masalah dengan korupsi memori non-ECC? Karena pekerjaan menulis ke setiap disk akan menjadi proses yang berbeda kesalahan memori yang sama yang terjadi dalam satu penulisan tidak akan secara teoritis terjadi pada yang lain?

Jika kamu beruntung. Tetapi apa yang akan menghentikan Anda untuk berhasil dan tanpa cacat menyalin file yang sudah diperbaiki?

Apakah ada perangkat lunak / perangkat keras RAID1 yang dirancang untuk bekerja dengan lebih dari dua drive, dan karena itu dapat menangani perilaku seperti un-raid1 tradisional seperti bit-rot, URE dll? Dengan pengaturan mirror disk tradisional jika disk A melaporkan 0 dan B melaporkan 1, Anda tidak tahu siapa yang membalik, tetapi dalam tiga atau lebih solusi disk tidak bisakah Anda tidak 'memperbaiki' disk aneh yang keluar? A = 0, B = 1, C = 0 sehingga B pasti terbalik?

Ada 'RAID1-flavour' yang disebut RAID5 ....

Serius meskipun, RAID3,4,5, dan RAID6 datang ke pikiran. Tidak perlu memaksakan cermin menjadi sesuatu yang lain.

Pada saat yang sama, akankah solusi RAID1 seperti itu mendukung pembacaan paralel dari lebih dari dua disk untuk memberikan kecepatan baca yang dipercepat? Ini sangat penting karena saya membayangkan ada banyak bisnis yang membaca data yang sama lebih banyak daripada mengeditnya.

RAID 5 akan. Dan RAID 6, dan ...

RAID bukan solusi cadangan. Jadi jika Anda mengikuti praktik yang baik dan memiliki antara 2-3 lokasi penyimpanan, apakah ini dimaksudkan bahwa hanya satu di antaranya yang terlindung dari kegagalan drive melalui skema RAID atau apakah Anda mengharapkan lokasi di luar kantor kedua juga memiliki redundansi multidisk?

Saya ingin cadangan offline . Satu tidak dapat diakses melalui Internet dan di lokasi yang berbeda secara fisik. Cadangan kedua yang dapat dijangkau dan diperbarui setiap hari juga bagus. Tetapi sebagian besar dalam kasus kebakaran dan sejenisnya.

Mothly backup untuk benar-benar aman offline dan setiap hari ke tape / disk / cloud akan menjadi tambahan yang bagus untuk itu.

Apakah ini kasus bahwa bahkan satu drive, yang disimpan di lokasi yang berbeda dianggap dilindungi dari kegagalan perangkat karena itu berada dalam hubungan cermin yang 'efektif' dengan drive di lokasi lain?

RAID bukan cadangan. Bagian dari RAID bukanlah cadangan yang tepat. Bahkan disk dari cermin multidisk. Bergantung pada implementasi RAID Anda, mungkin berhasil atau tidak. Cadangan yang tepat selalu berfungsi. Bahkan setelah memperbarui perangkat lunak (misalnya driver RAID).

Jika tidak, maka apakah RAID1 tidak menawarkan redudansi untuk jumlah drive minimum terendah (2)?

Ia menawarkan redudancy ke sektor yang tidak dapat digunakan kembali atau disk yang rusak.

Dan hanya itu yang biasanya dibutuhkan. Redundansi yang cukup untuk menjaga semuanya tetap berjalan sampai Anda dapat melakukan perawatan darurat.

Hennes
sumber