Bagaimana cara mengartikan Hasil SMART HDD?

58

Laptop saya baru-baru ini mulai menjadi sedikit tidak dapat diandalkan, dan untuk beberapa alasan saya mulai curiga bahwa HDD saya mulai gagal. Setelah sedikit berburu di internet, saya menemukan Disk Utility Ubuntu di menu System dan menjalankan diagnostik SMART yang panjang dari ini.

Namun, karena dokumentasi untuk Disk Utility sangat buruk ( palimpsest?), Saya tidak yakin bagaimana menafsirkan hasilnya:

Nilai lebih dari 50 juta untuk tingkat kesalahan baca, namun tesnya bagus ?!

Misalnya, Tingkat Kesalahan Baca lebih dari 50 juta (!), Namun Penilaian tersebut dinilai "Bagus".

Jadi, bisakah seseorang menjelaskan kepada saya bagaimana menafsirkan hasil tes ini (terutama angka Normalisasi, Terburuk, Ambang, dan Nilai)? Dan mungkin beri tahu saya apa pendapat mereka tentang hasil yang saya dapatkan untuk HDD saya? (Terima kasih)

Marty
sumber
Apakah "Hardware ECC pulih" nilai yang sama dengan "Baca tingkat kesalahan"? Disk saya memiliki 676 siklus daya, dihidupkan pada 285 hari, dan memiliki 193 juta kesalahan. Dibandingkan dengan milik saya, disk Anda memiliki kesalahan terlalu banyak, tapi saya hanya berspekulasi di sini.
Ngomong
Yip - keduanya sama!
Marty

Jawaban:

54

Anda memiliki deskripsi yang baik tentang cara kerja SMART di wikipedia . Tapi intro cepat:

  • Nilai: Ini adalah nilai mentah yang dilaporkan controller. Biasanya itu adalah nilai yang mudah dipahami (seperti daya pada jam atau suhu), tetapi terkadang tidak (seperti tingkat kesalahan baca). Pabrikan yang berbeda dapat menggunakan struktur dan makna yang berbeda untuk data ini.

  • Normalisasi: Ini adalah nilai di atas dinormalisasi sehingga nilai yang lebih tinggi selalu lebih baik. Jadi angka 114 dalam tingkat baca / kesalahan lebih baik dari 113. Sekali lagi, bagaimana hard drive Anda mengubah data mentah menjadi nilai normal adalah khusus vendor.

  • Terburuk: Nilai normalisasi terburuk yang dimiliki drive Anda di masa lalu (di mana 99 kemungkinan merupakan pengaturan pabrik).

  • Threshold: Ketika normalisasi nilainya lebih rendah dari nilai ini drive cenderung gagal.

Jadi, hard disk Anda sepertinya ok. Nilai tingkat kesalahan baca bukan kali drive Anda gagal, tetapi beberapa struct data yang tergantung pada produsen disk Anda.

Javier Rivera
sumber
jika drive tertentu tidak melaporkan nilai yang dinormalisasi , lalu apakah itu berarti terburuk dan ambang batas akan dilaporkan dalam istilah atau apakah semua drive menggunakan nilai yang dinormalisasi dan hanya beberapa yang memilih untuk melabeli mereka hanya sebagai "nilai"?
DeveloperACE
25

Ya, umumnya nilai mentah untuk tingkat kesalahan baca adalah omong kosong. Nilai yang ingin Anda awasi adalah jumlah sektor yang dialokasikan kembali, jumlah yang tertunda, dan offline tidak dapat diperbaiki. Itu adalah hitungan sektor buruk yang telah, sedang menunggu, atau tidak dapat diperbaiki, dan nilai mentah di sana secara umum masuk akal dan merupakan hitungan sektor.

Jika membaca suatu sektor gagal, itu menjadi tertunda. Lain kali Anda mencoba menulis ke sektor itu, drive akan mencoba untuk menulis ulang, dan jika itu berfungsi, semuanya akan kembali normal. Jika tidak dapat menulis sektor dengan benar, maka sektor tersebut akan dialokasikan kembali dari kumpulan cadangan. Jika tidak bisa melakukan itu (mungkin sudah habis menggunakan kolam cadangan?), Maka itu hanya menjadi offline_uncorrectable dan mencoba membaca atau menulis untuk itu hanya kesalahan keluar.

psusi
sumber
1
Saya punya drive yang cukup banyak hanya gagal tingkat kesalahan membaca mentah. Tes hanya gagal setelah drive berjalan beberapa saat, mungkin 15 menit; di bawah Windows gejalanya adalah bahwa setiap akses drive yang menghalangi proses, jadi saya menggunakan alat Ubuntu untuk menentukan apa yang salah, tapi saya bingung apa yang dikatakannya salah dengan drive, karena tingkat kesalahan baca tidak T tampaknya mengindikasikan segala jenis kegagalan drive - namun drive pasti memiliki masalah!
Michael
Saya juga harus menambahkan bahwa hasil tes itu sendiri ambigu. Tes keseluruhan mengatakan bahwa itu gagal, tetapi tes tingkat kesalahan baca, meskipun memiliki nilai konyol (100/100, terburuk, dinormalisasi) mengatakan "Oke".
Michael
9

psusi berhasil.

Jika Anda membaca lembar data (kertas putih) katakan di seagate.com, Anda akan melihat bagaimana HDD dibuat, diuji, dan cara kerjanya. Tidak ada HDD yang sempurna, tidak pernah ada, tidak akan pernah ada, (sejarah dan fakta). Di masa lalu, kami harus memasukkan bad sector ke pengontrol HDD dari daftar di kertas yang ada di kotak drive baru, sehingga pengontrol melewatkannya.

Drive modern memiliki koreksi kesalahan. Dari hari 1 sektor buruk.

Jadi mereka memetakannya, ini berarti drive melompati sektor buruk. Bahkan mereka "secara logis ditukar" - sektor yang buruk dipetakan ke sektor silinder cadangan yang baru dan bagus (memiliki silinder cadangan - anggap silinder sebagai trek). Ini semua transparan bagi dunia luar - kecuali untuk utilitas SMART.

Setiap pabrikan dapat melakukan apa pun yang mereka mau, sehingga beberapa menetapkan kesalahan dihitung ke nol, meskipun mungkin ada 10 sektor buruk segera setelah drive diproduksi.

Ada 3 kali aturan dalam firmware drive - ia membaca sektor 3 kali dan jika semua 3 kali buruk maka mungkin melakukan "kalibrasi ulang" dengan cepat, dan membaca 3 kali lagi. Jika drive masih tidak ok itu akan memetakan sektor itu ke salah satu sektor cadangan. Ini jauh di dalam firmware, tetapi terjadi terus-menerus di latar belakang, semua transparan bagi pengguna.

Apakah pabrikan memilih untuk melaporkan kesalahan mentah setiap kali ada 3 pembacaan buruk atau setelah kalibrasi terserah mereka. Jadi seperti katanya di atas, itu tidak penting kecuali jika Anda memiliki banyak drive dari jenis yang sama dan Anda melihat beberapa tren aneh.

Butir 2: semua HDD memiliki kesalahan pembacaan alami, Anda juga dapat mempelajarinya di Seagate, jika Anda mau. tetapi mereka semua memiliki kesalahan dengan cepat. dan dibaca lagi, dan biasanya lulus ujian untuk kesalahan CRC. jika tidak, DRIVE mencoba menukarnya. jika Anda menjalankan cakram dingin, itu akan bertahan lama dan Anda banyak yang tidak pernah kehabisan silinder cadangan. tapi lihat itu seperti yang dikatakan psusi!

Saya mengetik ini, di PC lama, menjalankan salah satu HDD 1GB pertama yang pernah dibuat. dan masih bagus. (saya didukung) (tidak pernah kekurangan pendingin ...) panas adalah pembunuh nomor 1 dan lonjakan daya, saya menjalankan UPS. sorakan dan hari baik. Saya harap ini membantu. (Pernah melihat crash hard disk DatA General? dan mengisi ruangan dengan sejumlah besar wol aluminium, isyarat keriting? banyak kesenangan saat itu ... tidak pernah ada waktu yang membosankan ....

jtgh
sumber