Saya menjalankan sejumlah server CentOS 6 64bit dengan sistem file ext3 / ext4. Sejauh yang saya tahu, tidak ada dari mereka yang dimatikan secara tidak benar, tetapi semuanya telah mengumpulkan beberapa kesalahan sistem file yang dilaporkan oleh fsck sekarang.
Sekarang, beberapa drive (bukan sistem file) memiliki kesalahan IO yang akan menyebabkan kegagalan hard drive (kita menjalankan raid1) jadi apakah itu mengarah ke kesalahan sistem file? Saya tidak berpikir kesalahan itu akan diizinkan untuk naik ke sistem file?
Setidaknya satu tidak menunjukkan tanda-tanda kegagalan hard drive tetapi memiliki kesalahan fsck.
Jadi, apakah sistem file ext3 / 4 menumpuk kesalahan secara alami dari waktu ke waktu atau ada sesuatu yang buruk terjadi?
dmesg
berada pada level perangkat, dan hanya pada satu perangkat, jadi saya pikir raid1 akan melakukan hal yang benar dari perangkat yang baik. Juga, setidaknya satu server tidak memiliki kesalahan drive tetapi memiliki kesalahan sistem file.Jawaban:
Kesalahan sistem file tidak menyebabkan kesalahan I / O yang tidak menyebabkan Kegagalan Hard Drive. Faktanya, kausalitas Anda sepenuhnya terbalik. Kegagalan Hard Drive menyebabkan kesalahan I / O, yang pada gilirannya menyebabkan kerusakan sistem file.
Kesalahan I / O akan dilaporkan sebagai kesalahan pada ruang pengguna. Dalam beberapa kasus ini dapat menyebabkan kerusakan sistem file (yang dapat diperbaiki oleh fsck), tetapi dalam beberapa kasus itu hanya dapat mengakibatkan korupsi blok data.
Jadi secara umum, itu tidak "normal" untuk korupsi sistem file untuk mengumpulkan dalam sistem file ext3 / ext4. Itu umumnya berarti Anda memiliki beberapa jenis masalah perangkat keras. Ini bisa jadi masalah memori; atau kegagalan hard drive; dll. Sebenarnya jika Anda melihat kesalahan I / O, Anda harus memperbaikinya terlebih dahulu. Bug perangkat lunak pada umumnya tidak menyebabkan kegagalan perangkat keras!
sumber
Ext3 adalah sistem file yang sepenuhnya andal, yang tidak berlaku untuk Ext4 (lebih tergantung pada Kernel)
Namun, beberapa kesalahan dapat dilakukan dari kabel / konektor data yang longgar, atau bahkan getaran / kejutan yang terjadi pada hard drive (mengenai casing PC dengan kaki Anda, memindahkan laptop Anda, dll.)
sumber