Cara menentukan seberapa mati HDD dari laporan SMARTCTL

11

Saya mendapat laporan acak di Terminal terbuka hari ini dengan mengatakan bahwa "Hard drive saya hampir gagal!"

Saya melakukan beberapa tes dan saya tidak yakin seberapa buruk ini. Komputer bekerja dengan baik tetapi saya melanjutkan dan mendorong semua pekerjaan saya ke github. Saya tidak ingin terus bekerja di komputer ini jika ada kemungkinan itu hanya crash dan saya akan kehilangan segalanya.

Drive ini adalah HDD - Western Digital Caviar SE Serial ATA

Seperti apa seharusnya smartctl normal untuk drive yang stabil?

Atribut SMART:

masukkan deskripsi gambar di sini

Gagal Tes:

masukkan deskripsi gambar di sini

Objekt baru
sumber
Apakah Anda benar-benar berbicara tentang SSD? Terutama yang Spin_Up_Timemengejutkan saya dalam konteks SSD.
mpy
Ya, ternyata tidak. Saya mendapat huruf drive bingung pada saat itu. Saya memiliki 5+ drive yang terhubung ke mesin ini dan semuanya memiliki ukuran yang sama.
Objekt baru
Harap perbarui pertanyaan Anda sesuai, kemudian juga jawaban DavidPostill cocok dengan pertanyaan itu.
mpy
@ mpy Selesai. Jawaban David tampaknya baik-baik saja tanpa suntingan.
Objekt baru

Jawaban:

11

Saya melakukan beberapa tes dan saya tidak yakin seberapa buruk ini

Jawaban singkat:

Cadangkan drive ini dan ganti segera .

Jawaban panjang:

Sebuah perusahaan bernama Backblaze telah mengumpulkan data tentang kegagalan hard drive. Telah dirilis bahwa data di blog perusahaan, menyoroti drive produsen yang gagal lebih sering daripada yang lain.

Dalam sebuah blog baru - baru ini menerbitkan data yang menunjukkan dengan tepat 5 atribut SMART yang mengindikasikan kegagalan drive yang akan terjadi:

Dari pengalaman, kami telah menemukan 5 metrik SMART berikut ini menunjukkan kegagalan drive disk yang akan terjadi:

  • SMART 5 - Reallocated_Sector_Count.
  • SMART 187 - Reported_Uncorrectable_Errors.
  • SMART 188 - Command_Timeout.
  • SMART 197 - Current_Pending_Sector_Count.
  • SMART 198 - Offline_Unororableable.

Kami memilih 5 statistik ini berdasarkan pengalaman dan masukan kami dari orang lain di industri karena mereka konsisten di seluruh pabrikan dan mereka adalah prediktor yang baik untuk kegagalan.

Artikel selanjutnya menyarankan:

SMART 5: Reallocated_Sector_Count
1-4 keep an eye on it, more than 4 replace

SMART 187: Reported_Uncorrect
1 or more replace

SMART 188: Command_Timeout
1-13 keep an eye on it, more than 13 replace

SMART 197: Current_Pending_Sector_Count
1 or more replace

SMART 198: Offline_Uncorrectable
1 or more replace

Dalam kasus Anda 5 (nilai mentah 2), 197 (nilai mentah 484) dan 198 (nilai mentah 371) menunjukkan tanda-tanda kegagalan.

DavidPostill
sumber