Saya bertanya-tanya apakah hasil SMART selftest ini menunjukkan kegagalan drive, ini adalah satu-satunya drive yang muncul dengan 'selesai: baca kegagalan' dalam hasil.
# smartctl -l selftest /dev/sde
smartctl version 5.38 [i686-pc-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/
=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Extended offline Completed: read failure 90% 8981 976642822
# 2 Extended offline Aborted by host 90% 8981 -
# 3 Extended offline Completed: read failure 90% 8981 976642822
# 4 Extended offline Interrupted (host reset) 90% 8977 -
# 5 Extended offline Completed without error 00% 410 -
Drive belum menunjukkan tanda-tanda kegagalan, selain dari output dari selftest SMART itu. Ini adalah output dari drive yang berbeda di sistem yang sama yang saat ini menjalankan SMART selftest
# smartctl -l selftest /dev/sdc
smartctl version 5.38 [i686-pc-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/
=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Extended offline Self-test routine in progress 30% 15859 -
# 2 Extended offline Completed without error 00% 9431 -
# 3 Extended offline Completed without error 00% 8368 -
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail Always - 1
3 Spin_Up_Time 0x0027 176 175 021 Pre-fail Always - 4183
4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 48
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0
7 Seek_Error_Rate 0x002e 100 253 000 Old_age Always - 0
9 Power_On_Hours 0x0032 088 088 000 Old_age Always - 8982
10 Spin_Retry_Count 0x0032 100 253 000 Old_age Always - 0
11 Calibration_Retry_Count 0x0032 100 253 000 Old_age Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 46
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always - 34
193 Load_Cycle_Count 0x0032 200 200 000 Old_age Always - 13
194 Temperature_Celsius 0x0022 111 101 000 Old_age Always - 36
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0
197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always - 1
198 Offline_Uncorrectable 0x0030 200 200 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 1
200 Multi_Zone_Error_Rate 0x0008 200 200 000 Old_age Offline - 2
hard-drive
smart
Jeff Welling
sumber
sumber
smartctl -a /dev/sde
dan memposting bagian berlabelSMART Attributes Data Structure
yang berisi penghitung mentah. Khususnya yang pertama di sana adalahRaw_Read_Error_Rate
yang merupakan indikator "bad drive" terbaik (dan mungkin akan! 0 dalam kasus Anda).Jawaban:
Semoga Anda sudah lama mengganti drive, tetapi karena belum ada yang langsung menjawab pertanyaan ...
Anda menjalankan dua tes, yang keduanya gagal membaca sektor logis yang sama dari disk, seperti yang ditunjukkan oleh
Completed: read failure
dan LBA yang sama di kedua tes. Ini memang menunjukkan bahwa disk memiliki cacat, dan Anda harus dapat menggantinya dengan garansi. Mencoba untuk menyimpan data di sektor ini mungkin atau mungkin tidak menyebabkan drive untuk melihat itu rusak selama proses penulisan dan memetakan kembali sektor, tetapi jika drive tidak melihat, dan tidak dapat membaca data nanti, Anda telah kehilangan Itu.sumber
Apakah data Anda layak dipertaruhkan pada drive yang dicurigai?
Jika itu saya, saya akan mengganti drive dan bersyukur bahwa SMART menyelamatkan saya dari sakit kepala.
sumber
Saya ingin menambahkan komentar di jawaban yang lain, tetapi saya tidak bisa karena kurangnya perwakilan, lihatlah.
Anda tidak perlu membuat skrip cron, ada daemon smartd dalam paket smartmontools yang menangani apa yang ingin Anda lakukan: memeriksa status SMART secara teratur. Yang Anda butuhkan hanyalah membuat konfigurasi dan memulai layanan. Paket smartmontools juga berisi beberapa contoh skrip yang dapat dipanggil oleh smartd ketika sesuatu mulai gagal.
sumber
Apa yang akan saya lakukan dalam situasi Anda?
Pertama-tama saya mencari tahu file mana yang terpengaruh. Ada beberapa instruksi bagaimana melakukan ini http://smartmontools.sourceforge.net/badblockhowto.html#e2_example1 Ya. Dalam kasus Anda lebih sulit karena Anda memiliki array. Tapi itu mungkin. Daripada, pastikan bahwa file ini dicadangkan, daripada menulis nol ke sektor gagal. Dua hal bisa terjadi. 1. Drive berhasil menulis nol ke sektor ini. Current_Pending_Sector, Reallocated_Sector_Ct harus nol setelahnya. 2. Drive gagal menulis ke sektor ini. Daripada itu remaps sektor ini ke area "cadangan".
Bagaimanapun Anda berakhir dengan drive tetap. Anda harus mengembalikan file Anda dari cadangan (karena Anda menimpa satu sektor dari itu). Anda juga harus menjalankan kembali swa-uji lanjutan untuk memastikan tidak ada lagi kesalahan.
Tetap sehat!
PS Saya tahu bahwa posting ini agak tua. Tapi saya menipunya. Dan saya pikir itu ide yang bagus untuk memberikan jawaban yang baik.
sumber
Drive itu kemungkinan akan keluar. Tidak dapat membaca dari bagian drive adalah kondisi kegagalan yang pasti, dan sangat mungkin untuk terjadi tanpa tanda-tanda kegagalan disk yang khas. Jenis hal ini biasanya tidak sementara; tanpa tanda-tanda lain itu mungkin kepala yang lemah, masalah penyelarasan yang sangat sedikit, atau area yang rusak di piring (silinder?).
Alternatif lainnya adalah ada bug SMART; Anda benar-benar tidak ingin menjalankan drive dengan firmware kereta.
Setiap kali Anda melihat kesalahan sama sekali dari SMART, itu adalah pertanda kuat bahwa Anda harus mendapatkan drive baru untuk menghindari kehilangan data. Ini dimaksudkan sebagai sistem peringatan dini, sebagian.
sumber
Cadangkan secepatnya!
Jika drive ini masih dalam garansi, maka
badblocks
alat juga dapat digunakan untuk ini (Anda sudah memiliki cadangan, bukan?)sumber
badblocks -w
(penulisan 3x, membaca 3x) tanpa membuat bad sector baru, saya akan menyimpannya. Kalau tidak, itu terlalu rusak untuk digunakan di suatu tempat.