Haruskah saya menghindari menempatkan dua SSD dalam konfigurasi RAID1 karena penurunan kinerja?

15

Saya memiliki sistem workstation yang akan memiliki dua SSD industri 64GB, dan rencananya adalah memiliki kedua disk dalam konfigurasi RAID1 untuk redundansi yang diatur di kickstart. Sistem akan menjalankan CentOS 7. Dalam melihat ini, saya menemukan bahwa Panduan Administrasi Penyimpanan RHEL tidak merekomendasikan RAID1 untuk SSD.

Red Hat juga memperingatkan bahwa tingkat RAID perangkat lunak 1, 4, 5, dan 6 tidak direkomendasikan untuk digunakan pada SSD. Selama tahap inisialisasi level RAID ini, beberapa utilitas manajemen RAID (seperti mdadm) menulis ke semua blok pada perangkat penyimpanan untuk memastikan bahwa checksum beroperasi dengan benar. Ini akan menyebabkan kinerja SSD menurun dengan cepat.

Apakah ini sesuatu yang harus saya perhatikan dengan serius? Apakah ada alternatif untuk redundansi yang bisa saya gunakan?

Menurut dokumentasi RHEL lagi, mirroring LVM sekarang memanfaatkan RAID perangkat lunak MD, sehingga peringatan RAID juga berlaku untuk itu.

Info lebih lanjut: SSD adalah Swissbit X-200 series (SATA), dan sepertinya overprovisioning mencapai 40%.

RAID perangkat keras tidak akan menjadi pilihan, menurut tim perangkat keras.

mochatiger
sumber
Bisakah Anda menguraikan apa aplikasi itu? Apakah Anda menggunakan SSD industri karena ini adalah lingkungan yang keras atau semacam sistem pengontrol?
ewwhite
Ya, mesin akan berada di luar ruangan dan harus tahan terhadap kondisi suhu / lingkungan yang kasar.
mochatiger
2
Jika Anda benar-benar khawatir tentang hal itu, Anda dapat menggunakan mdadm -C --assume-clean...untuk menghindari sinkronisasi awal. Setidaknya dengan RAID-1.
derobert

Jawaban:

10

Saya tidak akan merekomendasikan perangkat lunak RAID Linux dengan SSD, terutama untuk boot. Saya akan mengambil keputusan berdasarkan skenario kegagalan potensial dan apa dampak dari downtime. Untuk SSD industri, saya biasanya menggunakannya mandiri, tanpa RAID.

Jika workstation ini gagal, seberapa cepat Anda bisa 1). pemulihan dari cadangan atau 2). membangun kembali / reimage?

Apa jenis SSD ini (make / model)? Jika mereka terlalu banyak, ini mungkin bukan masalah yang terlalu besar. Jika itu SATA dan terhubung ke motherboard, Anda akan memiliki beberapa opsi TRIM.

Anda dapat menggunakan pengontrol RAID perangkat keras LSI entry-level untuk memudahkan penyebaran dan pemulihan. Setidaknya RAID yang mendasarinya akan transparan ke OS.


Edit:

Ini adalah SSD industri yang sangat berlebihan . Konfigurasikan mirror RAID 1 seperti biasa dan pantau drive-drive tersebut seiring waktu.

putih
sumber
1
Meskipun jika Anda memutuskan untuk melakukan RAID perangkat keras, Anda perlu memastikan bahwa OS mendukung perangkat keras sehingga Anda dapat melihat keadaan perangkat yang mendasarinya, atau Anda tidak akan tahu kapan perangkat mulai gagal kecuali Anda secara fisik berada di depan. dari mesin. +1 dari saya, tetap.
MadHatter
Semua vendor RAID perangkat keras utama menyediakan perangkat lunak Linux yang dapat memantau masing-masing perangkat di belakang adaptor. Ini dapat diikat ke dalam Nagios, dll. Untuk pemantauan.
Stefan Lasiewski
Saya telah menempatkan jawaban untuk pertanyaan SSD / perangkat keras Anda sebagai info tambahan dalam pertanyaan (harap tidak apa-apa, saya baru di sini). Idenya adalah pada kesempatan langka bahwa salah satu drive ini gagal di lapangan, dapat memulihkan data cermin dari yang tidak gagal. Dampak kehilangan data tinggi. Mengetahui hal itu, apakah RAID1 masih tidak terlalu menjadi masalah seperti yang Anda katakan?
mochatiger
3
@mochatiger Mengetahui apa yang Anda katakan dan bahwa SSD sangat overprovisioned (40%), saya akan mengkonfigurasi perangkat lunak RAID 1 saat Anda berencana. Dokumentasi Red Hat dimaksudkan untuk kasus penggunaan umum dan perangkat keras konsumen. Situasi Anda pasti berbeda.
ewwhite
8

Apakah ini sesuatu yang harus saya perhatikan dengan serius?

Tidak

Apakah ada alternatif untuk redundansi yang bisa saya gunakan?

Saya lebih suka pengontrol RAID perangkat keras tapi itu hal pribadi, Anda baik-baik saja seperti ini.

Chopper3
sumber
1
Chopper dapat Anda jelaskan mengapa kita tidak perlu khawatir tentang ini? Tidakkah seharusnya kita peduli dengan apa pun yang menyebabkan 'kinerja SSD menurun dengan cepat.'?
Stefan Lasiewski
2
Tentu, jika Anda pertama kali menjelaskan bagaimana tingkat kerja ini mungkin dapat menyebabkan 'kinerja SSD menurun dengan cepat' mengingat perusahaan yang berspesifikasi 2014 (OP menggunakan istilah 'industri') SSD.
Chopper3
5

Pertanyaan yang harus Anda tanyakan adalah kapan dokumentasi itu ditulis. Mereka umumnya menggunakan bahan yang sama dan memperbaruinya jika diperlukan, dan teknologi SSD telah berubah sejak saat itu.

Meskipun mereka industri, kinerja menulis dan membaca tidak sama. Dokumentasi mengacu pada kinerja menulis, tetapi dengan pengaturan mirror, Anda akan mendapatkan kinerja membaca yang lebih baik dengan / boot dan / mount.

Jadi mempertanyakan dokumentasi dalam beberapa hal bermanfaat.

paulcube
sumber
1

Anda dapat menggunakannya tanpa banyak masalah dalam konfigurasi RAID1 lunak (bahkan jika SSD tidak terlalu banyak), tetapi hanya memberi Anda TRIM di atasnya setelah membuat.

Anda dapat melakukannya dengan salah satu dari yang berikut:

  • menggunakan kernel yang cukup baru yang mendukung MD meneruskan TRIM ke SSD (setidaknya 3.8.sesuatu dengan IIRC, tapi tolong periksa), dan menjalankan fstrim (8) (dari paket util-linux) setiap malam

  • menggunakan kernel yang cukup baru dan memiliki opsi mount "discard" (untuk ext4 / xfs). Perhatikan bahwa ini adalah kinerja yang lebih rendah daripada di atas, karena TRIM tidak dapat diganggu gugat, dan ini tidak memanfaatkan batching di atas

  • pada kernel yang lebih tua, jalankan cron night run dari mdtrim . Pastikan untuk menguji dengan skrip uji yang disediakan sebelum memasukkan data penting ke dalamnya!

Perhatikan juga bahwa itu semua hanya berlaku untuk sistem file secara langsung pada softRAID. Ini tidak akan berfungsi untuk sebagian besar semua perangkat keras RAID. Juga, itu (saat ini) tidak akan berfungsi jika Anda memiliki LVM atau lapisan lain di atas MD softraid. Anda akan membutuhkan penyediaan besar untuk bertahan hidup dari mereka (dan untungnya Anda memiliki 40% dari itu, jadi Anda baik-baik saja).

Matija Nalis
sumber