Saya sudah mulai memperhatikan hal-hal aneh di dmesg
log saya , dan SSD saya yang berumur 4 bulan. Sebagai contoh:
[ 9.647535] ata7.00: exception Emask 0x10 SAct 0x7ffffbff SErr 0x300000 action 0x6 frozen
[ 9.647542] ata7.00: irq_stat 0x08000000, interface fatal error
[ 9.647546] ata7: SError: { Dispar BadCRC }
[ 9.647551] ata7.00: failed command: READ FPDMA QUEUED
[ 9.647558] ata7.00: cmd 60/b0:00:18:51:0f/03:00:07:00:00/40 tag 0 ncq 483328 in
[ 9.647558] res 40/00:18:c8:5c:0f/00:00:07:00:00/40 Emask 0x10 (ATA bus error)
[ 9.647561] ata7.00: status: { DRDY }
[ 9.647564] ata7.00: failed command: READ FPDMA QUEUED
[ 9.647570] ata7.00: cmd 60/00:08:c8:54:0f/04:00:07:00:00/40 tag 1 ncq 524288 in
[ 9.647570] res 40/00:18:c8:5c:0f/00:00:07:00:00/40 Emask 0x10 (ATA bus error)
[ 9.647573] ata7.00: status: { DRDY }
Saya juga memperhatikan bahwa nilai-nilai SMART saya aneh:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
183 Runtime_Bad_Block 0x0032 100 100 000 Old_age Always - 16
199 UDMA_CRC_Error_Count 0x0032 100 100 000 Old_age Always - 23
Runtime bad block tampaknya stabil, tetapi tampaknya kesalahan UDMA CRC meningkat setelah setiap reboot (mungkin karena di Dispar BadCRC
atas), yang tidak baik ..
Setelah riset online, saya sudah mencoba mengganti kabel SATA, tetapi sepertinya tidak membantu.
Setelah sistem menyala, saya tidak dapat benar-benar melihat sesuatu yang berbeda, semuanya tampak berfungsi, tetapi saya tidak dapat memastikan karena ini adalah disk sistem dan tidak terlalu banyak ditulis.
Saya telah melihat tip ini tentang menonaktifkan NCQ , tetapi saya memiliki dua disk lain di sana yang mendapat manfaat dari NCQ, dan tidak ada tip tentang cara menonaktifkannya untuk drive itu saja.
Apakah ini disk yang sekarat? Adakah yang tahu bagaimana menemukan penyebabnya?
Berikut adalah sisa dari garis dmesg aneh: http://pastebin.com/HCxiPwkM
Dan keluaran smartctl: http://pastebin.com/h4c4MkEb
EDIT :
Ini juga terjadi saat mesin sedang berjalan:
Jun 13 00:27:48 kernel: [21674.310312] ata7.00: exception Emask 0x10 SAct 0x400 SErr 0x100000 action 0x6 frozen
Jun 13 00:27:48 kernel: [21674.310317] ata7.00: irq_stat 0x08000000, interface fatal error
Jun 13 00:27:48 kernel: [21674.310320] ata7: SError: { Dispar }
Jun 13 00:27:48 kernel: [21674.310323] ata7.00: failed command: READ FPDMA QUEUED
Jun 13 00:27:48 kernel: [21674.310327] ata7.00: cmd 60/00:50:00:36:4f/01:00:00:00:00/40 tag 10 ncq 131072 in
Jun 13 00:27:48 kernel: [21674.310327] res 40/00:50:00:36:4f/00:00:00:00:00/40 Emask 0x10 (ATA bus error)
Jun 13 00:27:48 kernel: [21674.310329] ata7.00: status: { DRDY }
Jun 13 00:27:48 kernel: [21674.310333] ata7: hard resetting link
Jun 13 00:27:49 kernel: [21674.802471] ata7: SATA link up 6.0 Gbps (SStatus 133 SControl 330)
Jun 13 00:27:49 kernel: [21674.843512] ata7.00: configured for UDMA/133
Jun 13 00:27:49 kernel: [21674.845404] ata7: EH complete
Menurut tautan ini , PSU mungkin penyebabnya ..?
EDIT 2
Sudah mencoba mengubah keadaan hari ini, semua disk saya menggunakan kabel PSU yang sama, sekarang tidak, tetapi sepertinya tidak membantu ..
Runtime_Bad_Block 18
UDMA_CRC_Error_Count 25
Jawaban:
Beberapa hari setelah memindahkan semua disk saya ke pengontrol SATA internal, kesalahan telah hilang dan nilai-nilai SMART tidak meningkat.
Sekarang masih harus dilihat apakah ini adalah ketidakcocokan spesifik antara SSD saya dan pengontrol Marvell, atau pengontrol telah mati seluruhnya; yang mungkin apa yang terjadi..tapi itu topik untuk hari lain.
sumber