Cara mengatur ulang hasil SMART

16

Bagaimana saya bisa mereset hasil SMART sehingga tidak mendaftarkan hasil sebelumnya. Alasan saya adalah bahwa saya menguji hard drive yang ditutup bersama pada case yang tertutup. Ini membuat salah satu HDD gagal membaca Suhu Airflow.

Setelah membuka case (Yang menurunkan Temp semua drive 10 derajat Celcius dalam 5 menit) dan kemudian memisahkan drive sedikit lebih (3 derajat kurang) Semua hasil baik tetapi karena pembacaan Aliran Udara gagal dalam pembacaan sebelumnya, selalu terlihat gagal.

Jadi bagaimana saya bisa mereset bacaan untuk SMART?

masukkan deskripsi gambar di sini

Luis Alvarado
sumber
1
Saya pikir Anda dapat menggunakan Mhdd untuk mematikan pintar, Ada dengan alat floppy di sysresccd.org/System-tools bukan ide terbaik ... tapi mungkin layak untuk dilihat.
Mateo
2
Mengapa Anda ingin mengatur ulang?
Angelo
Yah itu pada dasarnya 3 tahun yang lalu, tapi saya rasa itu karena, pada saat itu, HDD berada di tempat yang memiliki BANYAK panas eksternal. Setelah memindahkannya ke sebuah ruangan dengan iklim yang lebih dingin, masalahnya masih tetap ada, meskipun suhunya berubah dari 68 derajat menjadi 37 derajat. Jadi masalahnya adalah kenaikan suhu eksternal yang menciptakan masalah pada awalnya tetapi masih terlihat setelah memindahkannya ke tempat lain.
Luis Alvarado

Jawaban:

0

Hard drive memiliki ruang luang untuk alasan pemulihan. Pemulihan terjadi secara otomatis. Alat pemulihan hanya memetakan sektor buruk secara fisik ke ruang cadangan ini. Setelah dipetakan ulang, ketika membaca atau menulis terjadi pada sektor yang buruk, drive mengubah akses ke ruang kosong, dan menyembunyikan kesalahan.

Sejujurnya saya tidak tahu cara mengatur ulang data SMART. Itu adalah sesuatu yang dipertahankan oleh hard drive secara internal, dan bagaimanapun hal itu akan menjadi hal yang buruk untuk dilakukan.

SMART melaporkan bahwa hard drive Anda rusak! Menyetel ulang penghitung tidak akan mengubah fakta bahwa ambang kesalahan untuk drive telah terlampaui.

Jadi TIDAK, Anda tidak dapat mengatur ulang riwayat SMART. Itu dipasang di pabrik untuk evaluasi drive setelah kegagalan. SMART hanya dapat dinonaktifkan atau diaktifkan.

Saya harap ini menjawab pertanyaan Anda.

Mitch
sumber
Hai Mitch, sebagaimana dijelaskan dalam pertanyaan, kegagalan itu tidak nyata. Itu karena semua HDD diletakkan sangat tertutup bersama di ruang berventilasi buruk. Setelah mengubah itu dan menguji lagi itu berfungsi dengan baik kecuali bahwa itu masih menyebutkan kegagalan masa lalu. Untuk saat ini saya melakukan sudo smartctl -l sataphy berikut, reset / dev / sdd yang menyelesaikan masalah Assesment Keseluruhan dengan mempertimbangkan kegagalan sebelumnya yang sekarang tampak normal, tetapi kegagalan masih muncul untuk atribut spesifik. Sekali lagi, HDD sebenarnya tidak gagal tetapi kesalahan sebelumnya masih menunjukkan.
Luis Alvarado
Saya mengerti, tetapi ini mungkin tampak normal, hanya tersembunyi. Anda bertanya apakah itu dapat diatur ulang, dan jawabannya adalah TIDAK. Meskipun Anda dapat menyembunyikan kesalahan tersebut, begitu drive masuk ke pabrikan dengan alasan apa pun, mereka dapat mengetahui apa yang sebenarnya salah dengan drive tersebut dari waktu ke waktu. Semua yang saya katakan bahwa kesalahan sebelumnya masih menunjukkan, dan kecuali Anda dapat menggunakan alat yang digunakan oleh manufaktur, untuk mengembalikan status SMART drive, itu akan tetap ditampilkan.
Mitch
26

Sebenarnya ada cara untuk mereset data SMART. Anda hanya perlu konverter rs232 ke usb sederhana (uart to ttl) dan beberapa kabel yang terpasang pada antarmuka diagnostik hdds. (ada di sisi kanan port sata, 5 atau 4 pin) Anda harus menghubungkan kabel RX TX dan GND (dan kabel power tentu saja: D) kemudian nyalakan HDD dan sambungkan dengan dempul atau hyperterminal (linux dapat terhubung dengan itu terminal sendiri saya kira) misalnya untuk drive seagate: untuk 7200.10 dan baud rate yang lebih lama adalah 9600 untuk 7200.11 dan yang lebih baru adalah 38400

perintah setelah koneksi tekan CTRL + Z lalu ketik "/ 1" tekan enter ketik "N1" tekan enter ketika selesai lepaskan semua kabel dan nyalakan HDD seperti biasa untuk melihat perubahan :)

untuk info hdd lainnya gunakan google :)

MRX
sumber
5
Ini sepertinya hanya berlaku untuk drive Seagate tetapi Anda benar, video ini menjelaskan prosesnya.
Adrian Frühwirth
5
Salah satu rekan kerja saya menghubungi Seagate, dan mereka mengatakan kepada kami bahwa mereka telah mengunci fitur ini sehingga tidak dapat diakses tanpa alat berpemilik. Tidak yakin pada titik apa mereka melakukan ini.
JFA
4

Data SMART tidak terlalu standar di antara pabrikan, tetapi uji Suhu Hard Drive harus menunjukkan apakah suhu drive telah melampaui ambang batas di masa lalu: http://en.wikipedia.org/wiki/SMART#Known_ATA_S.MART_attributes

Pemikirannya adalah bahwa terlalu panas meningkatkan peluang Anda untuk gagal. SMART tidak mengatakan drive Anda buruk, tetapi memiliki peluang peningkatan kegagalan di masa depan.

SMART dimaksudkan sebagai audit terhadap riwayat drive dan dikelola oleh drive itu sendiri, sehingga Anda tidak dapat "mengatur ulang" atau "menghapus" nilai-nilai SMART.

SlightlyCuban
sumber
3

Titik atribut saat ini / terburuk seperti suhu persis seperti ini: untuk memberi tahu Anda jika drive pernah berada di luar suhu pengoperasian maksimalnya, dan karenanya mungkin mengalami kerusakan permanen.

Itu sebabnya ia mengatakan "gagal di masa lalu", bukan "gagal sekarang": Anda baru saja menyentuh ambang batas maksimum. Perhatikan tampilan atribut menunjukkan "dinormalisasi: 50, ambang batas: 45, terburuk: 45". (Ini adalah nilai normal 0..200 seperti untuk atribut lainnya, bukan temps Celsius mentah.)

Anda juga memiliki beberapa sektor buruk (kesalahan sektor tidak dapat diperbaiki), jadi apakah suhu tinggi yang singkat menyebabkan hal itu atau tidak, mungkin sudah waktunya untuk membuang drive itu.

UI perangkat lunak SMART yang lebih baik akan menunjukkan kepada Anda suhu saat ini dan maks . misalnya
smartctl -a /dev/sdaatau smartctl -x /dev/sda( -xmencetak semua data SMART dan non-SMART yang tersedia yang dapat diperoleh dari drive, termasuk log riwayat suhu jika drive memilikinya, dengan grafik batang ASCII.)

smartctl -x menyertakan ini untuk hard drive WD Green 1TB (WD10EADS) lama:

Current Temperature:                    36 Celsius
Power Cycle Min/Max Temperature:     25/42 Celsius
Lifetime    Min/Max Temperature:     35/46 Celsius

Perangkat lunak yang Anda gunakan sepertinya hanya menampilkan suhu saat ini, yang sedikit di bawah ambang batas, tetapi tidak akan menyembunyikan fakta bahwa drive di luar spesifikasi di beberapa titik di masa lalu.


Anda tentu bisa membenarkan mengabaikan suhu tinggi sesaat itu, jika Anda benar-benar memperbaikinya dalam hitungan menit. Tetapi Anda tidak akan (atau seharusnya tidak) pernah dapat membuat drive itu sendiri berbohong tentang fakta bahwa itu sudah melebihi nilai maks temp sementara untuk beberapa waktu, dan dengan demikian atributnya gagal di masa lalu.

Anda bisa mengonfigurasi smartduntuk mengabaikan atribut apa pun yang diberikan sehingga Anda masih bisa mendapatkan notifikasi yang berguna jika ada hal lain yang melewati ambang batas ke wilayah yang gagal secara resmi. : smartd.conf(5)mengatakan:

-i ID [ATA only]Abaikan ID nomor atribut perangkat saat memeriksa kegagalan atribut penggunaan. ID harus berupa bilangan bulat desimal dalam rentang 1 hingga 255. Petunjuk ini mengubah perilaku Petunjuk '-f' dan tidak memiliki efek tanpanya.

Ini berguna, misalnya, jika Anda memiliki disk yang sangat lama dan tidak ingin terus menerima pesan tentang atribut Atribut seumur hidup (biasanya Atribut 9) gagal. Petunjuk ini dapat muncul beberapa kali untuk satu perangkat, jika Anda ingin mengabaikan beberapa Atribut.


Atribut sejarah suhu yang diperpanjang

Saya baru saja mendapatkan Seagate Barracuda 6TB baru (firmware ST6000DM003-2CY186 0001, drive 5425 RPM), yang memiliki beberapa statistik menarik, termasuk waktu yang dihabiskan melebihi titik operasi min / max, dan temps jangka pendek dan log jangka pendek / tinggi .

SCT Status Version:                  3
SCT Version (vendor specific):       522 (0x020a)
Device State:                        Active (0)
Current Temperature:                    33 Celsius
Power Cycle Min/Max Temperature:     27/33 Celsius
Lifetime    Min/Max Temperature:     27/33 Celsius
Under/Over Temperature Limit Count:   0/0

SCT Temperature History Version:     2
Temperature Sampling Period:         3 minutes
Temperature Logging Interval:        59 minutes
Min/Max recommended Temperature:     14/55 Celsius
Min/Max Temperature Limit:           10/60 Celsius
Temperature History Size (Index):    128 (2)

Dan di bagian detail lengkap:

0x05  =====  =               =  ===  == Temperature Statistics (rev 1) ==
0x05  0x008  1              33  ---  Current Temperature
0x05  0x010  1               -  ---  Average Short Term Temperature
0x05  0x018  1               -  ---  Average Long Term Temperature
0x05  0x020  1              33  ---  Highest Temperature
0x05  0x028  1              30  ---  Lowest Temperature
0x05  0x030  1               -  ---  Highest Average Short Term Temperature
0x05  0x038  1               -  ---  Lowest Average Short Term Temperature
0x05  0x040  1               -  ---  Highest Average Long Term Temperature
0x05  0x048  1               -  ---  Lowest Average Long Term Temperature
0x05  0x050  4               0  ---  Time in Over-Temperature
0x05  0x058  1              55  ---  Specified Maximum Operating Temperature
0x05  0x060  4               0  ---  Time in Under-Temperature
0x05  0x068  1              13  ---  Specified Minimum Operating Temperature

(Drive hanya dinyalakan selama beberapa menit; itu mungkin mengapa tidak -ada data di beberapa bidang.)

Jika drive Anda memiliki atribut yang diperluas ini, Anda dapat menunjukkan kepada seseorang bahwa waktu yang dihabiskan di luar temp yang diizinkan sangat singkat (jika itu masalahnya). Agaknya jika Anda akan memodifikasi data SMART, Anda hanya akan melakukan itu dan menghapus setiap menyebutkan itu berada di luar jangkauan, tetapi jelas Anda tidak dapat 100% mempercayai data apa pun dari drive 2-tangan yang seseorang mencoba menjualmu.

Lihat /superuser/1389522/what-does-it-mean-when-my-new-hdd-reports-errors-at-a-time-that-shouldnt-exist untuk lebih lanjut tentang drive yang digunakan dengan "odometer rollback" pada atribut "Power_On_Hours" mereka misalnya.

Peter Cordes
sumber
Terima kasih Peter atas analisis menyeluruhnya di sini. Sangat dihargai.
Luis Alvarado
0

Sepengetahuan saya, satu-satunya cara untuk menghentikannya adalah mematikan SMART di BIOS. Ini hanya akan menghentikan PERANGKAT KERAS.

OS Anda masih akan meminta drive untuk info SMART dan memberitahu Anda itu gagal.

Jesseryte
sumber