Kesalahan SSD SMART dan kesalahan dmesg aneh, apakah ini disk yang sekarat?

3

Saya sudah mulai memperhatikan hal-hal aneh di dmesglog saya , dan SSD saya yang berumur 4 bulan. Sebagai contoh:

[    9.647535] ata7.00: exception Emask 0x10 SAct 0x7ffffbff SErr 0x300000 action 0x6 frozen
[    9.647542] ata7.00: irq_stat 0x08000000, interface fatal error
[    9.647546] ata7: SError: { Dispar BadCRC }
[    9.647551] ata7.00: failed command: READ FPDMA QUEUED
[    9.647558] ata7.00: cmd 60/b0:00:18:51:0f/03:00:07:00:00/40 tag 0 ncq 483328 in
[    9.647558]          res 40/00:18:c8:5c:0f/00:00:07:00:00/40 Emask 0x10 (ATA bus error)
[    9.647561] ata7.00: status: { DRDY }
[    9.647564] ata7.00: failed command: READ FPDMA QUEUED
[    9.647570] ata7.00: cmd 60/00:08:c8:54:0f/04:00:07:00:00/40 tag 1 ncq 524288 in
[    9.647570]          res 40/00:18:c8:5c:0f/00:00:07:00:00/40 Emask 0x10 (ATA bus error)
[    9.647573] ata7.00: status: { DRDY }

Saya juga memperhatikan bahwa nilai-nilai SMART saya aneh:

ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       16
199 UDMA_CRC_Error_Count    0x0032   100   100   000    Old_age   Always       -       23

Runtime bad block tampaknya stabil, tetapi tampaknya kesalahan UDMA CRC meningkat setelah setiap reboot (mungkin karena di Dispar BadCRCatas), yang tidak baik ..

Setelah riset online, saya sudah mencoba mengganti kabel SATA, tetapi sepertinya tidak membantu.

Setelah sistem menyala, saya tidak dapat benar-benar melihat sesuatu yang berbeda, semuanya tampak berfungsi, tetapi saya tidak dapat memastikan karena ini adalah disk sistem dan tidak terlalu banyak ditulis.

Saya telah melihat tip ini tentang menonaktifkan NCQ , tetapi saya memiliki dua disk lain di sana yang mendapat manfaat dari NCQ, dan tidak ada tip tentang cara menonaktifkannya untuk drive itu saja.

Apakah ini disk yang sekarat? Adakah yang tahu bagaimana menemukan penyebabnya?

Berikut adalah sisa dari garis dmesg aneh: http://pastebin.com/HCxiPwkM

Dan keluaran smartctl: http://pastebin.com/h4c4MkEb

EDIT :

Ini juga terjadi saat mesin sedang berjalan:

Jun 13 00:27:48 kernel: [21674.310312] ata7.00: exception Emask 0x10 SAct 0x400 SErr 0x100000 action 0x6 frozen
Jun 13 00:27:48 kernel: [21674.310317] ata7.00: irq_stat 0x08000000, interface fatal error
Jun 13 00:27:48 kernel: [21674.310320] ata7: SError: { Dispar }
Jun 13 00:27:48 kernel: [21674.310323] ata7.00: failed command: READ FPDMA QUEUED
Jun 13 00:27:48 kernel: [21674.310327] ata7.00: cmd 60/00:50:00:36:4f/01:00:00:00:00/40 tag 10 ncq 131072 in
Jun 13 00:27:48 kernel: [21674.310327]          res 40/00:50:00:36:4f/00:00:00:00:00/40 Emask 0x10 (ATA bus error)
Jun 13 00:27:48 kernel: [21674.310329] ata7.00: status: { DRDY }
Jun 13 00:27:48 kernel: [21674.310333] ata7: hard resetting link
Jun 13 00:27:49 kernel: [21674.802471] ata7: SATA link up 6.0 Gbps (SStatus 133 SControl 330)
Jun 13 00:27:49 kernel: [21674.843512] ata7.00: configured for UDMA/133
Jun 13 00:27:49 kernel: [21674.845404] ata7: EH complete

Menurut tautan ini , PSU mungkin penyebabnya ..?

EDIT 2

Sudah mencoba mengubah keadaan hari ini, semua disk saya menggunakan kabel PSU yang sama, sekarang tidak, tetapi sepertinya tidak membantu ..

Runtime_Bad_Block       18
UDMA_CRC_Error_Count    25
dr Hannibal Lecter
sumber
1
Penyebab paling mungkin adalah pengontrol SATA Anda entah bagaimana rusak. Nah, antarmuka SATA SSD juga bisa. Mungkin juga ada beberapa gangguan listrik yang kuat dari komponen lain di dalam PC.
Daniel B
MBO saya adalah "Asrock 770 Extreme3", saya baru saja memindahkan semua drive saya ke controller SATA internal, SSD dan / home drive saya ada di controller Marvell 6Gbps .. Saya telah boot tanpa kesalahan, tetapi mereka tidak terjadi setiap waktu, saya harus menunggu sedikit. Mungkin ada waktu untuk MBO dan CPU baru jika pengontrol digoreng ..: - &
dr Hannibal Lecter
Referensi kesalahan SATA untuk siapa pun yang memiliki masalah yang sama: lime-technology.com/wiki/index.php/The_Analysis_of_Drive_Issues
dr Hannibal Lecter

Jawaban:

0

Beberapa hari setelah memindahkan semua disk saya ke pengontrol SATA internal, kesalahan telah hilang dan nilai-nilai SMART tidak meningkat.

Sekarang masih harus dilihat apakah ini adalah ketidakcocokan spesifik antara SSD saya dan pengontrol Marvell, atau pengontrol telah mati seluruhnya; yang mungkin apa yang terjadi..tapi itu topik untuk hari lain.

dr Hannibal Lecter
sumber