Apakah saya memerlukan kontroler RAID kedua untuk toleransi kesalahan?

9

Saya memiliki server dengan 3 hard drive terpasang, dan total kapasitas 6. Kami berencana untuk memaksimalkannya, tetapi konsultan kami juga menyarankan untuk mendapatkan kontroler RAID kedua "untuk redundansi" untuk mendukung drive baru. Bagi saya, ini tidak masuk akal. Bahkan dengan pengontrol RAID kedua yang menjalankan setengah dari disk, kami masih terjebak dengan hanya setengah dari disk / program / data kami jika salah satu pengontrol mati (yang tidak jauh lebih baik daripada berjalan dengan tidak ada). Kami menempatkan vmware di server dan dia secara samar-samar menyebutkan beberapa fitur toleransi kesalahan / kegagalan fungsi, tetapi jika disk tidak dapat diakses karena pengontrol yang gagal, bagaimana cara kerjanya?

Hanya menghitung alasan redundansi, bukan kinerja, mengapa saya ingin memiliki pengontrol RAID kedua di server saya?

Bigbio2002
sumber
Saya telah melihat sejarah ketika satu-satunya pengontrol RAID gagal, membuat penyimpanan multi-disk RAID tinggi yang telah diservis sendiri tidak hanya tidak dapat digunakan tetapi bahkan semua data di sana tidak dapat dipulihkan. Itu merupakan pukulan berat bagi perusahaan. Pada akhirnya sebagian besar data telah direkonstruksi dari file yang ditemukan di workstation. Rasa malu total. Selalu mirror data pada cluster disk independen dengan controller yang jelas. Jangan pernah berasumsi bahwa RAID 6 akan menyelamatkan hidup Anda dalam semua kasus jika Anda mengandalkan satu kartu kecil yang panasnya 80 ° C saat beroperasi selama bertahun-tahun 7/24.
H22

Jawaban:

11

Dalam desain 'satu kotak ketersediaan tinggi' maka ya, Anda ingin pengontrol kedua, idealnya di bus kedua juga. Tetapi pendekatan semacam ini telah memberi jalan kepada desain yang lebih murah berdasarkan pengelompokan di mana satu kotak kegagalan tidak menghentikan layanan. Jadi itu tergantung pada apakah Anda berencana untuk menggunakan lingkungan berkerumun atau bergantung pada satu kotak. Bahkan jika jawaban Anda adalah yang terakhir memiliki pengontrol ganda dapat dilihat sebagai menambah kompleksitas tambahan dan mungkin berlebihan.

sunting - berdasarkan komentar Anda tentang menggunakan ESXi pada pertanyaan Anda yang lain. Saya harus mengatakan bahwa pengelompokannya luar biasa , kami memiliki banyak klaster 32-arah yang bekerja dengan sangat baik.

Chopper3
sumber
AFAIK, kita tidak akan menggunakan pengelompokan. Bagaimana pengontrol kedua dalam satu kotak menguntungkan saya? Apakah ada yang namanya failover pengontrol?
Bigbio2002
1
Tidak di dunia ESX / ESXi no - satu pun akan baik-baik saja, pastikan Anda mendapatkan controller yang akan membuat satu array R10 besar dari semua 6 disk tetapi memungkinkan Anda untuk membuat disk logis 2TB (atau kurang) ini ok. Pxxx-series HP memungkinkan Anda melakukan itu.
Chopper3
7

Pengontrol RAID kedua yang digunakan secara aktif bukan untuk redundansi. Hanya jika itu adalah pengontrol cold-stand-by di mana Anda mengalihkan semua disk Anda ketika yang pertama mati. Maka Anda memiliki redundansi (untuk controller). Tapi hati-hati melakukannya, seperti yang diposting di sini .

Jadi RAID adalah untuk redundansi disk yang mengarah ke satu titik kegagalan pada controller. Memiliki pengontrol kedua (yang tidak digunakan) dapat menyelesaikan ini karena Anda dapat mengalihkan semua disk ke yang baru. Jika ini bekerja tergantung pada faktor-faktor lain ...

Saya bukan penutur asli, tetapi bagi saya "toleransi kesalahan" adalah sesuatu yang berbeda dari "redundansi". Bisakah beberapa penutur bahasa Inggris membantu saya di sini?

mailq
sumber
Redundansi adalah cara untuk mencapai toleransi kesalahan :). Saya sedang mencari sesuatu di sepanjang cold-standby atau failover controller. Apakah ini fitur yang didukung, atau saya harus menukar kartu secara manual?
Bigbio2002
Saya belum pernah melihat pengontrol di mana pengalihan disk dilakukan secara otomatis. Ini karena saya tidak mencarinya atau karena saya tidak bisa membayangkan bagaimana Anda harus menghubungkan kabel antara satu disk dan dua pengontrol.
mailq
Drive dual-porting cukup umum di lingkungan perusahaan (bayangkan rak SAN) - tetapi harga naik dengan faktor 2 atau 3, jelas.
adapttr
3

Pada satu kotak, Anda sebenarnya membutuhkan dua pengontrol RAID, yang terhubung ke dua kompleks akar PCI-E yang berbeda, untuk memiliki redundansi subsistem I / O yang lengkap. Ini dapat dicapai dengan dua konfigurasi berbeda:

  • menggunakan disk SAS porting ganda yang mahal, dengan setiap tautan SAS terhubung ke pengontrol yang berbeda. Dengan cara ini, setiap pengontrol terhubung ke setiap disk. Jelas, dua pengontrol tidak dapat beroperasi pada disk secara bersamaan; beberapa bentuk penguncian / pagar diperlukan untuk mengoordinasikan akses ke disk. SCSI memiliki beberapa ketentuan khusus untuk menyediakan mekanisme pemagaran yang diperlukan, tetapi ini harus dikoordinasikan oleh perangkat lunak yang sesuai. Dengan kata lain, Anda tidak bisa begitu saja menghubungkan disk ke dua pengontrol dan menyebutnya sehari; alih-alih, Anda memerlukan konfigurasi perangkat lunak yang sesuai untuk membuatnya berfungsi tanpa masalah;
  • menggunakan single SAS / SATA disk link yang normal dan lebih murah, menghubungkan satu setengahnya ke setiap controller. Misalnya dengan 6 disk, Anda harus menghubungkan 3 disk ke controller dan 3 disk ke controller lain. Pada setiap pengontrol, konfigurasikan array RAID sesuai kebutuhan (misalnya: RAID 5 atau RAID1). Kemudian, pada level OS, Anda dapat mengonfigurasi RAID perangkat lunak antara dua array disk, mencapai redundansi array penuh. Meskipun lebih murah, solusi ini memiliki kelemahan tambahan untuk secara efektif membagi dua kapasitas penyimpanan Anda (karena tingkat perangkat lunak RAID1).

Masalah utama dengan kedua pendekatan ini adalah Anda tidak memiliki redundansi sistem penuh: masalah motherboard / CPU dapat menurunkan seluruh sistem, terlepas dari berapa banyak pengontrol / disk yang Anda miliki.

Untuk alasan ini, jenis redundansi-in-a-box seperti ini jarang digunakan akhir-akhir ini (selain penyebaran SAN menengah / high-end); alih-alih, pengelompokan / mirroring jaringan mendapatkan traksi luas. Dengan pengelompokan (atau mirroring jaringan) Anda memiliki redundansi sistem penuh, karena sistem tunggal yang gagal tidak dapat meniadakan akses data. Jelas pengelompokan memiliki perangkap sendiri sehingga bukan peluru perak / mudah, tetapi dalam beberapa situasi keuntungannya tidak dapat dinegasikan. Selain itu, Anda juga dapat menggunakan mirroring jaringan asinkron untuk memiliki redundasi data yang hampir realtime pada lokasi yang berbeda secara geografis, sehingga satu peristiwa bencana tidak akan mendatangkan malapetaka pada data Anda.

shodanshok
sumber
Dengan beberapa jenis data, salinan yang hanya setengah diperbarui (karena sinkronisasi gagal di tengah jalan) mungkin tidak dapat digunakan. Database adalah contoh khas, tetapi juga berbagai kode sumber dan kumpulan data dengan banyak file kecil yang saling bergantung satu sama lain.
h22
Itu tergantung pada mekanisme replikasi yang mendasarinya. DRBD, misalnya, memungkinkan penggunaan replikasi tersinkronisasi penuh (protokol C) atau hampir penuh (protokol B). Ini berarti bahwa ketika sebuah penulisan diakui pada host sumber, itu sebenarnya dilakukan pada host jarak jauh juga. Dengan kata lain, hambatan penulisan dihormati pada kedua host). Dengan jaminan seperti itu, sistem file / database yang kuat harus pulih tanpa masalah.
shodanshok
Ya, beberapa database mendukung replikasi, dan beberapa aplikasi lain juga. Ini jelas jauh lebih mudah untuk dikerjakan.
h22
1

Anda membutuhkan drive SAS dua porting untuk menyediakan failover aktual pada banyak pengontrol. Meskipun ini memang ada, itu jelas uncheap - tidak dalam kisaran harga satu server yang hanya memiliki penyimpanan internal.

Ini adalah teknologi yang sering digunakan dalam sistem SAN, di mana kematian pengontrol adalah masalah nyata.

Untuk satu server tanpa kemampuan failover lainnya, controller kedua tidak akan mendapatkan apa-apa - itu hanya akan menghabiskan lebih banyak uang dan memberi konsultan lebih banyak keuntungan.

adaptr
sumber