Apakah drive SSD dapat diandalkan seperti drive mekanis (2013)?

162

Drive SSD telah ada selama beberapa tahun sekarang. Namun masalah keandalan masih muncul.

Saya kira ini adalah tindak lanjut dari pertanyaan ini diposting 4 tahun yang lalu, dan terakhir diperbarui pada tahun 2011. Sekarang 2013, telah banyak berubah? Saya kira saya sedang mencari beberapa bukti nyata, lebih dari sekadar firasat. Mungkin Anda menggunakannya di DC Anda. Apa pengalaman Anda?

Keandalan drive SSD


MEMPERBARUI:

Sekarang 2016. Saya pikir jawabannya mungkin ya (sayangnya masih lebih mahal per GB).

Laporan ini memberikan beberapa bukti:

Keandalan Flash dalam Produksi: Yang Diharapkan dan Yang Tidak Terduga

Dan beberapa data menarik pada drive mekanis (konsumen):

Backblaze: Data dan Statistik Hard Drive

Mat
sumber
2
Mengapa Anda mengatakan bahwa masalah keandalan masih muncul?
ewwhite
6
SSD laptop istri saya berhenti bekerja setiap beberapa bulan dan membutuhkan perbaikan "daya hidup tetapi jangan mencoba booting selama dua puluh menit". Lalu baik-baik saja lagi. Teknologi baru, cara baru untuk gagal.
Jaydee
3
Hanya satu titik data, saya khawatir: Saya mendapat MacBook Retina Pro pada bulan September tahun lalu, dan mengalami kegagalan terminal SSD dalam waktu 60 hari. Unit penggantian sudah baik-baik saja, tapi saya sangat khawatir sekarang karena penggantian-pengguna / upgrade ini benar-benar bukan pilihan.
Roddy
27
Anda tidak ingin drive yang andal. Jika gagal pada 2PM setiap hari, Anda dapat mengandalkannya untuk menyetel arloji Anda. Yang Anda inginkan adalah drive yang tangguh.
Alan B
3
SSD telah ada jauh lebih lama daripada "beberapa tahun sekarang". Lebih seperti 40, sebenarnya, dan bahkan jika Anda maksud SSD berbasis Flash, kita berbicara hampir 20 tahun.
alastair

Jawaban:

175

Ini akan menjadi fungsi dari beban kerja Anda dan kelas drive yang Anda beli ...

Dalam penyebaran server saya, saya belum mengalami kegagalan SSD yang ditentukan dengan benar. Itu melintasi berbagai jenis drive, aplikasi, dan beban kerja.

Ingat, tidak semua SSD sama !!

Jadi apa yang dimaksud dengan "spec-benar" ?

Jika pertanyaan Anda adalah tentang penggunaan SSD dalam aplikasi perusahaan dan server, cukup banyak yang telah berubah selama beberapa tahun terakhir sejak pertanyaan awal . Berikut adalah beberapa hal yang perlu dipertimbangkan:

  • Identifikasi kasus penggunaan Anda: Terdapat drive konsumen, drive perusahaan, dan bahkan SSD aplikasi industri yang kokoh . Jangan membeli disk murah yang ditujukan untuk penggunaan desktop dan jalankan database intensif untuk itu.

  • Banyak faktor bentuk yang tersedia: SSD hari ini dapat ditemukan dalam kartu PCIe, SATA dan SAS 1.8 ", 2.5", 3.5 "dan varian lainnya.

  • Gunakan RAID untuk server Anda : Anda tidak akan bergantung pada drive mekanis tunggal dalam situasi server. Mengapa Anda melakukan hal yang sama untuk SSD?

  • Komposisi drive: Ada SSD berbasis DRAM, serta jenis flash MLC, eMLC dan SLC. Yang terakhir memiliki masa pakai yang terbatas, tetapi mereka didefinisikan dengan baik oleh pabrikan. mis. Anda akan melihat batas penulisan harian seperti 5TB / hari selama 3 tahun .

  • Masalah aplikasi drive : Beberapa drive untuk penggunaan umum, sementara ada yang lain yang dioptimalkan untuk dibaca atau dioptimalkan untuk penulisan. Drive berbasis DRAM seperti sTec ZeusRAM dan DDRDrive tidak akan aus. Ini sangat ideal untuk lingkungan penulisan tinggi dan ke disk depan yang lebih lambat. Drive MLC cenderung lebih besar dan dioptimalkan untuk dibaca. Drive SLC memiliki masa pakai yang lebih baik daripada drive MLC, tetapi enterprise MLC tampaknya cukup baik untuk sebagian besar skenario.

  • TRIM tampaknya tidak masalah: Pengontrol RAID perangkat keras masih belum sepenuhnya mendukungnya . Dan sebagian besar waktu saya menggunakan SSD, itu akan berada pada pengaturan RAID perangkat keras. Itu bukan sesuatu yang saya khawatirkan dalam instalasi saya. Mungkin aku sebaiknya?

  • Daya Tahan: Penyisihan berlebih adalah umum di SSD kelas server. Kadang-kadang ini dapat dilakukan di tingkat firmware, atau hanya dengan mempartisi drive dengan cara yang benar. Algoritma level-aus juga lebih baik. Beberapa drive bahkan melaporkan statistik ketahanan seumur hidup. Sebagai contoh, beberapa SSD perusahaan Sandisk bermerek HP saya muncul 98% life remainingsetelah digunakan selama dua tahun.

  • Harga telah jatuh jauh: SSD mencapai harga yang tepat: rasio kinerja untuk banyak aplikasi. Ketika kinerja benar-benar diperlukan, sekarang jarang untuk drive mekanis standar.

  • Reputasi telah dipadatkan: misal Intel aman tetapi tidak berkinerja tinggi. OCZ tidak bisa diandalkan. Hard disk berbasis Sandforce bagus. sTec / STEC sangat solid dan merupakan OEM untuk banyak drive array kelas atas. Sandisk / Pliant serupa. OWC memiliki solusi SSD yang hebat dengan garansi luar biasa untuk server berdampak rendah dan untuk penempatan workstation / laptop.

  • Perlindungan kehilangan daya sangat penting: Lihatlah drive dengan superkapasitor / superkaps untuk menangani penulisan yang luar biasa selama peristiwa daya. Beberapa drive meningkatkan kinerja dengan cache onboard, atau meningkatkannya untuk mengurangi keausan. Supercaps memastikan bahwa penulisan tersebut disiram ke penyimpanan yang stabil.

  • Solusi hibrid: Vendor pengontrol RAID perangkat keras menawarkan kemampuan untuk menambah array disk standar dengan SSD untuk mempercepat baca / tulis atau berfungsi sebagai cache cerdas. LSI memiliki CacheCade dan penawaran perangkat keras / perangkat lunak Nytro . Perangkat lunak dan solusi tingkat OS juga ada untuk melakukan hal-hal seperti menyediakan cache lokal pada aplikasi, database atau sistem hypervisor. Sistem file canggih seperti ZFS sangat cerdas menggunakan SSD baca dan tulis; ZFS dapat dikonfigurasikan untuk menggunakan perangkat terpisah untuk caching sekunder dan untuk log maksud, dan SSD sering digunakan dalam kapasitas itu bahkan untuk kumpulan HDD.

  • Flash top-tier telah tiba: solusi flash PCIe seperti FusionIO telah matang ke titik di mana organisasi merasa nyaman menyebarkan aplikasi penting yang mengandalkan peningkatan kinerja. Solusi Appliance dan SAN seperti RanSan dan Violin Memory juga masih ada di luar sana, dengan lebih banyak pendatang masuk ke ruang itu.

masukkan deskripsi gambar di sini

putih
sumber
12
TRIM benar-benar penting dalam drive dengan ketentuan yang sangat sedikit, yang merupakan kasus utama pada drive konsumen di mana $ / GB sangat penting. Sebagian besar drive perusahaan memiliki cukup ketentuan yang tidak dimiliki TRIM.
Tuan Alpha
2
@ PakSmith Lihat apa yang saya tulis di atas. SSD yang berbeda memiliki karakteristik yang berbeda. Gunakan alat yang tepat untuk pekerjaan itu. Jika saya mengambil Corsair atau drive tingkat konsumen lainnya dan menggunakannya sebagai SSD untuk sistem database tulis-berat aktif atau sebagai perangkat log ZIL untuk array penyimpanan ZFS, saya akan membakarnya dalam satu atau dua bulan .
ewwhite
1
Pos luar biasa. Satu hal yang membuat saya kesal: Pengontrol RAID tidak selalu merupakan pilihan yang tepat dengan SSD. Pengontrol RAID dirancang untuk menghapus data dan menambahkan kode koreksi kesalahan di beberapa disk magnetik. Pengontrol SSD sudah menghapus data secara asli dan menambahkan kode koreksi kesalahan di beberapa bank NVRAM. Juga, menambahkan pengontrol RAID memperkenalkan satu SPOF tambahan, pengontrol RAID itu sendiri. Menggunakan pengontrol RAID yang terpisah seringkali merupakan pilihan yang tepat, tetapi kadang - kadang menggunakan SSD yang lebih baik (SATA / SAS kelas lebih tinggi atau bahkan kartu PCI-E seperti Fusion-IO) adalah pilihan yang lebih baik.
Jesper Mortensen
5
@rickyduck, Sebenarnya di pusat data, kegagalan drive tunggal dilindungi oleh RAID, dan berarti mengurangi beberapa $$$ untuk menggantinya tanpa downtime; sedangkan di rig gaming, kegagalan drive tunggal adalah kehilangan data total, dan OS menginstal ulang.
2
@MisterSmith bahkan SSD desktop kelas atas lebih murah per GB daripada yang ditargetkan untuk penggunaan pusat data biasa. Selain pengontrol yang lebih kuat dalam beberapa kasus (atau hanya firmware volume rendah yang disetel untuk throughput alih-alih kinerja burst), mereka mendapatkan flash terbaik yang terpotong dari bagian atas proses produksi karena banyak beban kerja server adalah perintah yang besarnya lebih intensif IO daripada desktop drive dan akan dengan cepat membunuh drive konsumen.
Dan Neely
59

Setiap laptop di tempat kerja saya memiliki SSD atau Hybrid sejak 2009. Pengalaman SSD saya dalam ringkasan:

  • Apa yang saya sebut drive "Generasi 1", dijual sekitar tahun 2009 kebanyakan:
    • Pada tahun pertama sekitar 1/4 meninggal, hampir semuanya dari Syndrome of Sudden Death (SSD - Ini lucu, tertawa). Ini sangat terlihat bagi pengguna akhir, dan menjengkelkan, tetapi perbedaan kecepatan yang drastis membuat pola kegagalan yang konstan ini dapat ditoleransi.
    • Setelah 3 tahun semua drive telah mati (Sudden Death atau Wear-out), kecuali dua yang masih menendang (sebenarnya L2Arc drive di server sekarang).
  • Drive "2nd Gen", dijual sekitar 2010-11, berbeda dari generasi sebelumnya karena tingkat Sindroma Kematian Mendadak mereka turun secara dramatis. Namun, "masalah" aus berlanjut.
    • Setelah tahun pertama sebagian besar drive masih berfungsi. Ada beberapa Kematian Mendadak. Pasangan gagal karena aus.
    • Setelah 2-3 tahun, beberapa lebih dari setengahnya masih bekerja. Tingkat kegagalan tahun pertama pada dasarnya terus berlanjut.
  • Drive "Gen 3", yang dijual tahun 2012+ semuanya masih berfungsi.
    • Setelah tahun pertama semua masih bekerja (mengetuk kayu).
    • Drive tertua yang saya dapatkan adalah dari Mar 2012, jadi belum ada data 2-3 tahun.

Kegagalan SSD (Kumulatif)


Pembaruan Mei 2014:
Beberapa drive "2nd Gen" telah gagal, tetapi sekitar sepertiga dari drive asli masih berfungsi. Semua drive "Gen ke-3" dari grafik di atas masih berfungsi (ketuk kayu). Saya pernah mendengar cerita serupa dari orang lain, tetapi mereka masih membawa peringatan yang sama tentang kematian di sayap cepat . Waspada akan menjaga data mereka didukung dengan baik.

Chris S
sumber
2
Pengalaman saya menggemakan ini. Yang mengatakan, kami masih menyediakan hard drive USB untuk digunakan karyawan sebagai cadangan mesin waktu (selain rejimen cadangan standar di luar kantor kami), untuk memungkinkan pemulihan granular yang cepat jika terjadi kegagalan atau kehilangan yang besar.
EEAA
22
Berikan generasi ketiga satu atau dua tahun lagi. ;)
Andy
7
Juga patut dicatat bahwa SSD jauh lebih mungkin menderita bug firmware daripada HDD; firmware keduanya lebih rumit dan kurang matang, yang bukan kombinasi yang baik.
alastair
2
@Andy benar. Dimulai dengan 2009, Anda mengatakan paruh adalah sekitar satu tahun. Untuk tahun 2010 hingga 2011, kami baru berusia 3 tahun untuk pertengahan kisaran itu sekarang, di mana Anda mengindikasikan paruh 3 tahun. Itu hanya bisa didasarkan pada pengamatan saat ini. Apakah waktu paruh untuk drive 2012 & 2013 telah meningkat lebih dari 3 tahun tidak dapat benar-benar diketahui sampai setidaknya 2016. (Kita bisa mencoba memperkirakan dari kegagalan awal, tetapi itu mungkin hanya akan menjadi cacat manufaktur yang terisolasi, tidak disebabkan oleh lama jangka panjang biasa.)
Andrew Vit
1
Saya telah menggunakan 2 x Intel X25M 80Gb G1 sejak 2010. Pekerjaan saya melibatkan proses baca / tulis yang berat. Setiap beberapa bulan saya mengatur ulang drive (saya tidak perlu) untuk mengembalikan kinerja, tetapi tidak ada masalah. Saya menambahkan 256GB Samsung 230 tahun lalu. Sejauh ini tidak ada masalah!
Antillar Maximus
18

Dalam pengalaman saya, masalah sebenarnya adalah pengontrol sekarat, bukan memori flash itu sendiri. Saya telah menginstal sekitar 10 SSD Samsung (830, 840 [tidak pro]) dan tidak ada yang membuat masalah sejauh ini. Sebaliknya total drive dengan pengendali Sandforce, saya punya beberapa masalah dengan drive agility OCZ, terutama membeku dalam interval waktu yang tidak teratur, di mana drive berhenti bekerja sampai saya mematikan / di komputer. Saya dapat memberi Anda dua nasihat:

  1. Jika Anda membutuhkan keandalan yang tinggi, pilih drive dengan MLC, flash SLC yang lebih baik. Samsungs 840 fe memiliki TLC flash, dan garansi pendek, saya pikir bukan tanpa alasan;)

  2. Pilih drive dengan pengontrol yang dikenal stabil.

klingt.net
sumber
Mengingatkan saya pada pengontrol sekarat pada pencahayaan berbasis LED saat ini. LED bertahan sangat lama tetapi pengendali sepertinya tidak.
Matt
1
Siapa tahu, tapi mungkin itu bagian dari industri yang sudah usang :)
klingt.net
11

www.hardware.fr salah satu situs berita perangkat keras Prancis terbesar adalah bermitra dengan www.ldlc.com salah satu pengecer online Prancis terbesar. Mereka memiliki akses ke statistik pengembalian mereka dan telah menerbitkan laporan tingkat kegagalan (papan ibu, catu daya, RAM, kartu grafis, HDD, SSD, ...) dua kali setahun sejak 2009.

Ini adalah statistik "kematian dini", 6 bulan sampai 1 tahun penggunaan. Pengembalian langsung ke pabrikan tidak dapat dihitung, tetapi kebanyakan orang kembali ke pengecer selama tahun pertama dan seharusnya tidak memengaruhi perbandingan antara merek dan model.

Secara umum tingkat kegagalan HDD memiliki lebih sedikit variasi antara merek dan model. Aturannya adalah kapasitas yang lebih besar> lebih banyak piring-piring> tingkat kegagalan yang lebih tinggi, tetapi tidak ada yang dramatis.

Tingkat kegagalan SSD secara keseluruhan lebih rendah tetapi beberapa model SSD benar-benar buruk dengan sekitar 50% pengembalian untuk yang terkenal selama periode yang Anda minta (2013). Tampaknya sudah berhenti sekarang bahwa merek terkenal itu dibeli.

Beberapa merek SSD "mengoptimalkan" firmware mereka hanya untuk mendapatkan hasil benchmark yang sedikit lebih tinggi dan Anda kadang-kadang berakhir dengan pembekuan, layar biru, ... Ini juga tampaknya tidak terlalu menjadi masalah sekarang dibandingkan pada tahun 2013.

Laporan tingkat kegagalan ada di sini:
2010
2011 (1)
2011 (2)
2012 (1)
2012 (2)
2013 (1)
2013 (2)
2014 (1)
2014 (2)
2015 (1)
2015 ( 1) 2015 (2)
2016 (1) )
2016 (2)

Sacha K
sumber
Berikut ini tautan ke versi terjemahan otomatis dari bahasa Prancis translate.googleusercontent.com/...
SDwarfs