Metode cepat untuk menentukan kesehatan drive SSD?

13

Saya memiliki drive Intel X-25M yang ditandai "gagal" dua kali dalam larik penyimpanan ZFS, seperti disebutkan di sini . Namun, setelah melepaskan drive, tampaknya untuk me-mount, membaca dan menulis di komputer lain (Mac, PC, penutup USB, dll.)

Apakah ada cara yang baik untuk menentukan kesehatan drive saat ini? Saya merasa bahwa kegagalan sebelumnya dalam solusi ZFS adalah konvergensi bug, pelaporan kesalahan yang buruk dan perangkat keras. Sepertinya drive ini mungkin memiliki kehidupan di dalamnya.

putih
sumber
apakah itu g1 atau g2?
Jim B
Ini adalah drive G2 120GB X25-M.
ewwhite

Jawaban:

12

Cara yang baik, tetapi tidak sempurna, untuk memeriksa kesehatan drive apa pun adalah dengan memeriksa atribut SMART.

Di bawah ini adalah atribut SMART yang ditetapkan untuk disk Intel X25-M G2 160GB, yang diambil menggunakan smartctl v5.41. (Versi ini penting, versi smartctl sebelumnya memiliki pemetaan atribut-nama yang berbeda, dan tidak benar-benar memahami tabel spesifik untuk drive ini).

# ./smartctl -data -A /dev/sda
smartctl 5.41 2011-06-09 r3365 [x86_64-linux-2.6.18-194.32.1.el5] (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 5
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED     RAW_VALUE
  3 Spin_Up_Time            0x0020   100   100   000    Old_age   Offline      -       0
  4 Start_Stop_Count        0x0030   100   100   000    Old_age   Offline      -       0
  5 Reallocated_Sector_Ct   0x0032   100   100   000    Old_age   Always       -       1
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       4076
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       67
192 Unsafe_Shutdown_Count   0x0032   100   100   000    Old_age   Always       -       30
225 Host_Writes_32MiB       0x0030   200   200   000    Old_age   Offline      -       148418
226 Workld_Media_Wear_Indic 0x0032   100   100   000    Old_age   Always       -       755
227 Workld_Host_Reads_Perc  0x0032   100   100   000    Old_age   Always       -       49
228 Workload_Minutes        0x0032   100   100   000    Old_age   Always       -       16956537
232 Available_Reservd_Space 0x0033   099   099   010    Pre-fail  Always       -       0
233 Media_Wearout_Indicator 0x0032   098   098   000    Old_age   Always       -       0
184 End-to-End_Error        0x0033   100   100   099    Pre-fail  Always       -       0

Ini menunjukkan bahwa drive telah memiliki 1 sektor yang dialokasikan kembali, telah menggunakan 1% dari ruang yang disediakan yang tersedia (atribut 232) dan 2% dari siklus program / hapus yang diproyeksikan (atribut 233). Itu telah memiliki 148418 * 32MiB (atribut 225) ditulis untuk itu.

Jika drive menunjukkan sejumlah besar sektor yang direalokasi, hal itu mungkin menjadi perhatian, karena ini mungkin menunjuk pada chip flash yang gagal (dengan cara yang sama bahwa sejumlah besar sektor yang dialokasikan kembali pada disk berputar umumnya mengarah ke kesalahan permukaan) ). End to End juga buruk - Saya memiliki beberapa disk 160GB X25-M G2 gagal dengan besar (> 1000) pelaporan kesalahan End to End. Hanya ada dua atribut kondisi kesalahan yang berguna hadir untuk disk ini, karena sebagian besar atribut SMART yang berguna untuk disk normal tidak berlaku untuk SSD.

Namun, SMART umumnya tidak dianggap 100% andal. Studi Google tentang kegagalan disk menemukan bahwa meskipun ada korelasi yang baik antara berbagai indikator peringatan dini SMART dan kegagalan drive, itu bukan alat yang berguna untuk memprediksi kerusakan drive individu. Untuk alasan ini saya biasanya menggunakan SMART sebagai cara membuktikan drive buruk (jika kesalahan ditampilkan, itu mungkin akan gagal dalam waktu dekat), daripada membuktikan drive masih bagus.

Daniel Lawson
sumber
1
Perhatikan bahwa penelitian Google berkonsentrasi pada indikasi pra-kegagalan dari SMART, yang ternyata kurang dapat diandalkan. Melaporkan kondisi kegagalan agak lebih akurat.
Chris S
2

Meskipun dibuat untuk hard drive "tradisional", utilitas "badblock" mungkin bermanfaat karena dimaksudkan untuk menjalankan semua sektor yang dapat dipetakan pada drive. Dengan pencegahan fragmentasi SSD dan remapping internal, SSD tidak dapat memberi tahu Anda bahwa drive tersebut baik. Namun, jika itu memberitahu Anda drive buruk, saya pasti akan membuang drive mati.

bot403
sumber
1

HD Tune (dan HD Tune Pro ) adalah alat yang hebat untuk mengukur kesehatan dan kinerja drive SSD Anda. Versi gratis (HD Tune) memiliki set fitur yang sangat terbatas, tetapi analisis kesehatan termasuk di dalamnya, jadi Anda beruntung. Versi Pro memiliki masa uji coba 15 hari yang sangat saya sarankan untuk dicoba, ini akan memberi Anda analisis mendalam yang hebat tentang kinerja SSD Anda.

András Szepesházi
sumber