Bagaimana keadaan SSD (2016) saat ini di RAID?

51

Ada banyak sumber daya yang tersedia secara online yang membahas penggunaan drive SSD dalam konfigurasi RAID - namun ini sebagian besar sudah ada beberapa tahun yang lalu, dan ekosistem SSD bergerak sangat cepat - tepat seperti yang kami harapkan rilis produk "Optane" Intel akhir tahun ini yang akan mengubah segalanya ... lagi.

Saya akan mengawali pertanyaan saya dengan menegaskan ada perbedaan kualitatif antara SSD tingkat konsumen (mis. Intel 535) dan SSD tingkat pusat data (mis. Intel DC S3700).

Perhatian utama saya berkaitan dengan TRIMdukungan dalam skenario RAID. Menurut pemahaman saya, meskipun sudah lebih dari 6 tahun sejak SSD diperkenalkan di komputer kelas konsumen dan 4 tahun sejak NVMe tersedia secara komersial - pengontrol RAID modern masih tidak mendukung mengeluarkan TRIMperintah untuk SSD yang terpasang - dengan pengecualian pengontrol RAID Intel dalam mode RAID-0.

Saya terkejut bahwa TRIMdukungan tidak hadir dalam mode RAID-1, mengingat cara drive saling mirror, tampaknya mudah. Tapi saya ngelantur.

Saya perhatikan bahwa jika Anda ingin toleransi kesalahan dengan disk (baik HDD dan SSD), Anda akan menggunakannya dalam konfigurasi RAID - tetapi karena SSD akan tanpa TRIM itu berarti mereka akan menderita Tulis-Amplifikasi yang mengakibatkan keausan tambahan, yang mana pada gilirannya akan menyebabkan SSD gagal sebelum waktunya - ini adalah ironi yang sangat disayangkan: sistem yang dirancang untuk melindungi terhadap kegagalan drive mungkin berakhir secara langsung.

Begitu:

  1. Apakah TRIMdukungan diperlukan untuk SSD modern (era 2015-2016)?

    1.1. Apakah ada perbedaan dalam kebutuhan untuk TRIMdukungan antara SATA, SATA-Express, dan SSD berbasis NVMe?

  2. Seringkali drive diiklankan sebagai memiliki peningkatan pengumpulan sampah built-in; apakah itu meniadakan kebutuhan akan TRIM? Bagaimana proses GC mereka bekerja di lingkungan RAID?

    1.1. Sebagai contoh, lihat QA ini dari 2010 yang menjelaskan penurunan kinerja yang sangat buruk karena tidak-MEMANGKAS ( https://superuser.com/questions/188985/how-badly-do-ssds-degrade-without-trim ) - dan ini artikel dari 2015 menyatakan bahwa menggunakan TRIM sangat disarankan ( http://arstechnica.com/gadgets/2015/04/ask-ars-my-ssd-does-garbage-collection-so-i-dont-need-trim -baik / ). Apa tanggapan Anda terhadap argumen kuat ini tentang perlunya TRIM?

  3. Banyak artikel dan diskusi dari tahun-tahun sebelumnya menyangkut flash SLC vs MLC dan bahwa SLC lebih disukai, karena masa pakainya jauh lebih lama - namun tampaknya semua SSD saat ini (terlepas dari di mana mereka berada pada spektrum Consumer-to-Enterprise) adalah MLC hari ini - apakah perbedaan relevansi ini lagi?

    1.1 Dan bagaimana dengan TLC flash?

  4. SSD perusahaan cenderung memiliki batas daya tahan / tulis yang jauh lebih tinggi (sering diukur dalam berapa kali Anda dapat menimpa drive sepenuhnya dalam sehari, sepanjang umur drive 5 tahun yang diharapkan) - jika batas siklus tulisnya sangat tinggi (mis. 100 selesai menulis per hari) apakah ini berarti mereka tidak perlu TRIMsama sekali karena batas itu sangat tinggi, atau - sebaliknya - apakah batas itu hanya dapat dicapai dengan menggunakan TRIM?

Dai
sumber
6
Meskipun saya tidak dapat menjawab pertanyaan Anda, saya pikir itu harus dipertimbangkan mengingat fakta bahwa industri kami sedang mencoba yang terbaik untuk mematikan RAID milik, penyedia cloud publik semua menggunakan SSD sekarang pada layanan komputasi dan penyimpanan, pasti mereka memecahkan ini dengan perangkat lunak, penghapusan kode dll. Inovasi komputasi awan telah mengekspos hal-hal seperti RAID perangkat keras, IOS IOS dan jaringan area penyimpanan eksklusif sebagai komoditas tidak berguna yang berfermentasi di bagian atas rantai makanan dan sebenarnya menghambat inovasi. hardware RAID tidak dapat dijual dalam skala (ke AWS, Azure, CERN) jadi ....
Sum1sAdmin
@ Sum1sAdmin penyedia cloud publik semua menggunakan SSD sekarang pada layanan komputasi dan penyimpanan. Apakah Anda mengatakan bahwa AWS atau BlackBlaze menyimpan data hanya pada SSD?
AL
@Aku juga tidak, aku hanya menunjukkan bahwa tawaran SSD untuk penyimpanan blok, file, objek, dan sesaat
Sum1sAdmin
Saya sepenuhnya tidak setuju dengan "perbedaan kualitatif" antara komersial dan konsumen. Saya dapat meyakinkan Anda bahwa tidak ada perbedaan dalam pembuatan NAND. Tentu ada produsen yang berbeda (Samsung vs Intel) tetapi tidak ada yang memiliki proses manufaktur konsumen khusus. Memang ada perbedaan fitur, tetapi tidak ada perbedaan kualitas.
Jim B
Berbicara tentang Optane, kita hampir setengah jalan pada tahun 2016 dan tidak terlihat ... Ada yang tahu apa kesepakatannya?
Jeff Meden

Jawaban:

24

Mari kita coba menjawab satu pertanyaan sekaligus:

  • Apakah dukungan TRIM diperlukan untuk SSD modern (era 2015-2016)?

Jawaban singkat: dalam banyak kasus, tidak. Jawaban panjang: jika Anda memesan ruang cadangan yang cukup (~ 20%), bahkan drive tingkat konsumen biasanya memiliki nilai konsistensi kinerja yang cukup baik (tetapi Anda harus menghindari drive yang, sebaliknya, tersumbat pada penulisan yang berkelanjutan). Drive tingkat perusahaan bahkan lebih baik, baik karena mereka memiliki ruang cadangan yang lebih tinggi secara default dan karena kombo kontroler / firmware mereka dioptimalkan ke arah penggunaan drive yang berkelanjutan. Sebagai contoh, lihat drive S3700 yang Anda referensikan: bahkan tanpa memangkas, ia memiliki konsistensi penulisan yang sangat baik.

  • Seringkali drive diiklankan sebagai memiliki peningkatan pengumpulan sampah built-in, apakah itu meniadakan kebutuhan untuk TRIM? Bagaimana proses GC mereka bekerja di lingkungan RAID

Pengumpul sampah drive melakukan keajaiban di dalam kotak pasir drive - tidak tahu apa-apa tentang lingkungan luar. Ini berarti bahwa (sebagian besar) tidak terpengaruh oleh tingkat RAID array. Yang mengatakan, beberapa level RAID (yang berbasis paritas, pada dasarnya) kadang-kadang dapat (dan dalam beberapa implementasi tertentu) meningkatkan faktor amplifikasi tulis, jadi ini pada gilirannya berarti pekerjaan yang lebih tinggi untuk rutinitas GC.

  • Banyak artikel dan diskusi dari tahun-tahun sebelumnya berkenaan dengan SLC vs MLC flash dan bahwa SLC lebih disukai, karena umurnya jauh lebih lama, namun tampaknya semua SSD (terlepas dari di mana mereka berada pada spektrum Consumer-to-Enterprise) adalah MLC hari ini - Apakah perbedaan relevansi ini lagi

Drive SLC pada dasarnya telah lenyap dari perusahaan, terutama diturunkan untuk tugas militer dan industri. Perusahaan yang ditandai sekarang dibagi dalam tiga kelas:

  • HMLC / MLCe flash adalah yang dengan chip MLC binned yang lebih baik, dan disertifikasi untuk mempertahankan setidaknya 25.000/30000 siklus penulisan ulang;
  • Chip MLC 3D memiliki rating sekitar 5000-10000 siklus penulisan ulang;
  • chip planar MLC dan 3D TLC normal diberi peringkat sekitar 3000 siklus penulisan ulang.

Pada kenyataannya, salah satu dari tipe flash di atas harus memberi Anda banyak kapasitas menulis total dan, pada kenyataannya, Anda dapat menemukan drive perusahaan dengan semua jenis flash di atas.

Perbedaan nyata antara drive perusahaan dan konsumen adalah:

  • controller / firmware combo, dengan drive perusahaan jauh lebih sulit untuk mati karena bug pengontrol yang tidak terduga;
  • cache tulis yang dilindungi daya, sangat penting untuk mencegah kerusakan pada Flash Translation Layer (FTL), yang disimpan pada flash itu sendiri.

Driver kelas perusahaan lebih baik sebagian besar karena pengontrol dan kapasitor daya, bukan karena flash yang lebih baik.

  • SSD perusahaan cenderung memiliki daya tahan / batas penulisan yang jauh lebih tinggi (sering diukur dalam berapa kali Anda dapat menimpa drive sepenuhnya dalam sehari, sepanjang umur drive 5 tahun yang diharapkan), apakah hal ini meniadakan kekhawatiran tentang Amplifikasi Tulis yang disebabkan oleh tidak menjalankan TRIM?

Seperti yang dinyatakan di atas, drive kelas perusahaan memiliki ruang cadangan default yang jauh lebih tinggi (~ 20%) yang, pada gilirannya, secara drastis menurunkan kebutuhan untuk TRIM reguler

Bagaimanapun, sebagai catatan tambahan, harap pertimbangkan beberapa perangkat lunak RAID yang mendukung TRIM (seseorang mengatakan Linux MDRAID? )

shodanshok
sumber
Hanya 35.000 siklus tulis ?! Kedengarannya tidak banyak. Saya kira masuk akal jika penggantian drive meningkat lebih murah daripada membeli kapasitas yang sama di SLC.
user253751
~ 30000 siklus penulisan ulang minimum yang dijamin tidak buruk: dengan peningkatan kapasitas yang dibawa oleh peralihan ke NAND 2-bit-per-sel, drive MLC jauh lebih murah daripada yang SLC sambil mempertahankan peringkat daya tahan yang sama. Selain itu, hari-hari ketika sel SLC kelas 50-nm diberi peringkat di> 100.000 siklus penulisan ulang mungkin hilang: bahkan drive perusahaan memiliki 34 / 25nm flash kelas (atau lebih kecil), dengan daya tahan yang lebih rendah secara intrinsik (yang juga mempengaruhi drive SLC).
shodanshok
@shodanshok Kesimpulan Anda adalah "Gunakan SSD kelas perusahaan (SAS) yang terpasang pada pengontrol RAID normal dan jangan khawatir tentang hal itu" - dan bahwa saya tidak akan melihat peningkatan kinerja dalam 5 tahun yang membutuhkan drive? Dan bahwa masalah kinerja yang didokumentasikan oleh pengguna lain hanya memengaruhi drive tingkat konsumen?
Dai
@Dai untuk drive "kelas perusahaan" Saya tidak bermaksud hanya SAS SSD, melainkan juga SSD SATA yang dipilih dapat dianggap "kelas perusahaan". Dan ya, drive perusahaan memiliki konsistensi kinerja yang sangat baik, bahkan dalam kondisi mapan (yaitu: sepenuhnya penuh). Untuk contoh drive seperti itu, lihat di sini . Bahkan beberapa drive konsumen, ketika ditambah dengan overprovision yang murah hati, bisa sangat konsisten. Lihat di sini untuk contoh.
shodanshok
1
Binning adalah proses melalui chip silikon yang diperiksa dan dikelompokkan berdasarkan kualitasnya. Jadi, chip MLC NAND perusahaan pada dasarnya adalah chip yang "lebih baik dibuat", lebih baik.
shodanshok
9

TRIM bukanlah sesuatu yang pernah saya khawatirkan ketika menggunakan SSD pada pengontrol RAID modern. SSD telah ditingkatkan, fitur pengontrol RAID perangkat keras telah dioptimalkan untuk beban kerja ini, dan pelaporan daya tahan biasanya sudah ada.

TRIM untuk drive SATA ujung bawah. Untuk SAS SSD, kami memiliki SCSI unmap, dan mungkin itulah alasan saya tidak memenuhi kebutuhan TRIM ...

Tetapi komentator lainnya benar. Software-Defined Storage (SDS) mengubah cara kita menggunakan SSD. Dalam solusi SDS, pengontrol RAID tidak relevan. Dan hal-hal seperti TRIM cenderung kurang penting karena SSD mengisi peran yang ditentukan. Saya memikirkan cache baca penyimpanan gesit atau ZFS L2ARC dan ZIL ... Mereka semua memenuhi kebutuhan spesifik dan perangkat lunak memanfaatkan sumber daya dengan lebih cerdas.

putih
sumber
3
UNMAP dan TRIM melakukan hal yang persis sama.
Michael Hampton
2
Trim / unmap selalu diperlukan - tanpanya, Anda harus sepenuhnya bergantung pada pengumpulan sampah internal
Jim B
Pengumpulan sampah internal bukanlah pengganti untuk TRIM. Tidak ada fungsi firmware yang dapat menggantikan apa yang dilakukan TRIM. Agak mengkhawatirkan begitu banyak jawaban di sini yang tidak mengerti apa yang sebenarnya dilakukan TRIM dan mengapa itu diperlukan. Lihat artikel seperti ini arstechnica.com/gadgets/2015/04/...
Shiv
1

Level RAID dengan SSD Jawaban di atas menunjukkan bahwa level RAID dengan paritas, seperti RAID 5, meningkatkan amplifikasi tulis. Sebenarnya ada lebih dari satu cara untuk mengartikan itu: dampak pada satu drive atau dampak pada set drive.

Dibandingkan dengan tidak ada redundansi, RAID 5 menambahkan penulisan ke set karena menambah paritas checksum. Dibandingkan dengan array RAID 0 dari drive (n-1), dampak per drive dari array RAID 5 dengan drive n tidak ada artinya. Masing-masing dari n drive menerima hanya sebanyak menulis. RAID 5 menambahkan 1 / (n-1) menulis ekstra ke set. Namun RAID 1 dan RAID 10, menambahkan penulisan 100% ekstra ke set, karena semua yang ditulis ke satu SSD ditulis ke mirror-nya.

Jadi, dalam hal menulis ke set RAID 5 vs set RAID 10 dengan jumlah drive yang sama, SSD dalam set RAID 5 akan menerima lebih sedikit penulisan. Dan itu tetap benar bahkan jika Anda meningkatkan jumlah SSD di RAID 10 yang disetel untuk menyamakan kapasitas yang dapat digunakan.

Keith J
sumber
0

shodanshok menyentuh jawaban yang sebenarnya di sini. Jika Anda memesan ruang ekstra, "ketentuan berlebih", daya tahan SSD Anda dan konsistensi kinerja penulisan keduanya akan meningkat seiring waktu, dan kurangnya dukungan TRIM menjadi sangat tidak relevan. Cadangan ruang ekstra itu dapat dilakukan sesederhana, dimulai dengan SSD baru, mempartisi kurang dari kapasitas penuh. Sebagian besar pengontrol dalam drive memperlakukan ruang yang tidak pernah digunakan sama dengan ruang yang disediakan dan karenanya secara signifikan mengurangi amplifikasi penulisan. Untuk boot dan OS, ruang cadangan 10% mungkin cukup. Untuk drive yang sering ditulis ulang, tambah ruang itu.

Keith J
sumber