Bagaimana cara membuat smartd tutup mulut tentang satu sektor tidak terkoreksi luring tertentu?

18

Saya memiliki disk dalam perangkat lunak dua disk RAID-1 yang baru-baru ini "sektor offline tidak dapat diperbaiki" muncul dalam status SMART.

198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       1

Ini tampaknya hanya tanda kegagalan disk yang akan terjadi jika semakin sering terjadi (dan karena drive dicerminkan, tidak ada risiko besar hilangnya data nyata juga). Pada saat itu, tes mandiri juga gagal di beberapa titik dan smartdmengirimi saya email untuk memberi tahu saya mengenai hal ini seperti yang seharusnya dilakukan.

Namun, menulis ke sektor yang rusak biasanya menyebabkan disk menggunakan salah satu sektor cadangannya yang ternyata memang karena karena saya ddmengedit disk, semua tes mandiri berjalan dengan baik. Dan badblocksjuga tidak menemukan alasan untuk mengeluh.

Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
[...]
# 5  Extended offline    Completed without error       00%      5559         -
# 6  Short offline       Completed without error       00%      5540         -
# 7  Short offline       Completed: read failure       90%      5524         63273368

Jumlah sektor yang rusak tidak berkurang meskipun seharusnya tidak, karena sektor yang rusak masih ada, meskipun tidak digunakan. Namun, smartdterus mengirimi saya email setiap malam:

The following warning/error was logged by the smartd daemon:

Device: /dev/sda [SAT], 1 Offline uncorrectable sectors

Ini jelas sangat menjengkelkan dan mematikan rasa panik saya yang refleks terhadap smartdsurat.

Disk adalah Western Digital WD20EARS dan smartdversinya adalah 5.41 2011-06-09 r3365.

Kristen
sumber

Jawaban:

23

Pada beberapa disk, Anda mungkin harus menggunakan -U 198+(atau -U +?) Di file konfigurasi.

Tolong hati-hati. Jika Anda bukan penanya yang asli, bacalah seluruh pertanyaan dengan cermat. Jika Anda menggunakan ini pada disk yang tidak membutuhkannya, itu akan menekan peringatan yang sepenuhnya valid.

Jika ´ + ´ ditentukan, laporan hanya akan dicetak jika jumlah sektor telah meningkat sejak siklus pemeriksaan terakhir. Beberapa disk tidak mereset atribut ini ketika sektor buruk dialokasikan ulang. Lihat juga ´-v 198, meningkat 'di bawah ini.

smartd.conf (5)

Misalnya, Anda menggunakan konfigurasi default di smartd.conf. Dalam hal ini, ada banyak komentar di file, tetapi satu-satunya baris non-komentar ada di sini:

# The word DEVICESCAN will cause any remaining lines in this
# configuration file to be ignored: it tells smartd to scan for all
# ATA and SCSI devices.  DEVICESCAN may be followed by any of the
# Directives listed below, which will be applied to all devices that
# are found.  Most users should comment out DEVICESCAN and explicitly
# list the devices that they wish to monitor.
DEVICESCAN

Tambahkan opsi ke akhir baris:

DEVICESCAN -U 198+
sourcejedi
sumber
1
-U 198+harus melakukannya. Temuan yang bagus!
Michael Hampton
ada ujian untuk ini?
JIV
1
@JIV diedit. Saya juga menambahkan peringatan. Harap berhati-hati dengan data Anda :-).
sourcejedi
0

ada dua kemungkinan dari mana surat-surat ini berasal. smartd dapat mengirim email dengan sendirinya, tetapi kemungkinan besar tidak dikonfigurasi dengan cara ini jadi saya berasumsi bahwa email ini dikirim dengan logcheck. Jika asumsi ini salah, Anda tidak perlu membaca lebih jauh.

logcheck memindai file-file log dan mengirimkan email jika dianggap Anda harus khawatir tentang apa pun yang terjadi pada / di sistem Anda.

Anda memiliki opsi untuk menulis aturan abaikan tanda centang yang memberi tahu tanda centang agar tidak mengirim pesan yang cocok dengan pola tertentu.

Anda dapat (di bawah sistem berbasis Debian) membuat file bernama "/etc/logcheck/ignore.d.server/smartd_own" dengan konten berikut:

^\w{3} [ :0-9]{11} [._[:alnum:]-]+ smartd\[[0-9]+\]: Device: /dev/sda \[SAT\], 1 Offline uncorrectable sectors$

Ini harus menyaring email yang menjengkelkan tetapi menulis Anda lagi jika penghitung sektor yang tidak dapat diperbaiki meningkat.

hennr
sumber
smartdmengirim pesan secara langsung, sayangnya. Ini tampaknya selalu merupakan opsi untuk mengubah ini. Saya akan mempertimbangkan ini jika tidak ada cara lain, jadi terima kasih!
Christian
Oh sial, toh kamu punya solusi sekarang.
hennr