Bagaimana menemukan penyebab sistem file utama hanya akan membaca mode

9

Ubuntu 12.04

Sistem file pergi ke mode hanya baca sering. Pertama-tama saya sudah membaca sistem file pertanyaan ini akan masuk ke mode read only sudah sering . Tapi aku harus tahu kalau itu bukan disebabkan oleh sesuatu yang lain dying hard drive. Ini adalah server yang disediakan oleh klien saya dan saya hanya menjalankan beberapa node.js workers+ satu node.js serverdan saya menggunakan mongodb.

Dari waktu ke waktu (setiap 20-50 jam) sistem tiba-tiba membuat filesystem hanya baca, proses mongodb gagal (karena read-only fs) dan pekerja / server simpul saya (yang dimulai oleh forever) baru saja terbunuh.

Berikut ini adalah log dari dmesg - Saya dapat melihat ada beberapa kesalahan dan pesan yang akan dibaca oleh FS saja, dan ada juga beberapa kesalahan JURNAL tapi saya ingin mencari penyebab kesalahan tersebut ..

http://speedy.sh/Ux2VV/dmesg.log.txt


sunting

smartctl -t long /dev/sda
smartctl 5.41 2011-06-09 r3365 [x86_64-linux-3.5.0-23-generic] (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net

SMART support is: Unavailable - device lacks SMART capability.
A mandatory SMART command failed: exiting. To continue, add one or more '-T permissive' options.

Apa yang saya lakukan salah? Sama untuk sda2.

Lebih lanjut sekarang ketika saya mengetik perintah apa pun yang tidak ada di shell saya mendapatkan ini:

Sorry, command-not-found has crashed! Please file a bug report at:
https://bugs.launchpad.net/command-not-found/+filebug
Please include the following information with the report:

edit2

Saya baru saja mendapat info bahwa server ini sebenarnya VPS dan mereka mengatakan kepada saya bahwa hard drive baik-baik saja dan mereka berada di RAID 10. Dan mereka mengatakan kepada saya bahwa "memaksa fsck di fstab seharusnya membantu" ...


sunting3

di sini adalah output dari mountperintah:

/dev/sda2 on / type ext4 (rw,errors=remount-ro)
proc on /proc type proc (rw,noexec,nosuid,nodev)
sysfs on /sys type sysfs (rw,noexec,nosuid,nodev)
none on /sys/fs/fuse/connections type fusectl (rw)
none on /sys/kernel/debug type debugfs (rw)
none on /sys/kernel/security type securityfs (rw)
udev on /dev type devtmpfs (rw,mode=0755)
devpts on /dev/pts type devpts (rw,noexec,nosuid,gid=5,mode=0620)
tmpfs on /run type tmpfs (rw,noexec,nosuid,size=10%,mode=0755)
none on /run/lock type tmpfs (rw,noexec,nosuid,nodev,size=5242880)
none on /run/shm type tmpfs (rw,nosuid,nodev)
none on /media/psf type prl_fs (rw,nosuid,nodev,sync,noatime,share,_netdev)

Jadi sebenarnya tidak ada drive sda? Hanya sda2?


sunting4

Output dari fsck -Nperintah:

root@ubuntu:~# fsck -N sda
fsck from util-linux 2.20.1
[/sbin/fsck.ext4 (1) -- /] fsck.ext4 sda /dev/sda2 
pengguna606521
sumber
Saya menggunakan masalah yang sama, ubuntu saya memiliki aplikasi NodeJS, MongoDB, Chrome, VSCode, Robomongo, terminal tilix, Matermost, Thunderbird dan aplikasi aktif tukang pos setiap hari
Ankur Loriya

Jawaban:

8
[26729.124569] Write(10): 2a 00 03 96 5a b0 00 00 08 00
[26729.124576] end_request: I/O error, dev sda, sector 60185264
[26729.125298] Buffer I/O error on device sda2, logical block 4593494
[26729.125986] lost page write due to I/O error on sda2

Bagi saya, itu bukti kuat bahwa Anda /dev/sdasedang dalam perjalanan keluar. Anda dapat menjalankan tes smartctl untuk konfirmasi ( smartctl -t long /dev/sda), tetapi saya akan cenderung untuk menggantinya sesegera mungkin.

Sunting : smartctlperintah yang saya berikan benar seperti yang tertulis. Terima kasih telah menunjukkan mode kegagalan dalam pertanyaan Anda; ini terlihat seperti Anda memiliki perangkat keras yang sangat lama, atau ada semacam lapisan terjemahan: virtualisasi, atau pengontrol RAID perangkat keras. Bisakah Anda mengklarifikasi?

Bolehkah saya mengulangi pernyataan saya bahwa HDD Anda sedang dalam perjalanan keluar? Pengujian sangat baik, tetapi mengganti perangkat keras sebelum sistem Anda berkemas dan data Anda hilang harus menjadi prioritas Anda sekarang. Harap, paling tidak pastikan bahwa cadangan Anda benar-benar terkini sebelum membuang waktu lagi smartctl.

Sunting 2 : tentu saja patut dicoba apa yang mereka sarankan - fscking sistem file - tapi saya punya sedikit harapan bahwa itu akan memperbaiki masalah karena FS Anda tidak jatuh ke mode ro karena inkonsistensi FS, itu jatuh ke mode ro karena masalah berbicara dengan perangkat keras yang mendasarinya.

Jika mereka memiliki keyakinan bahwa perangkat keras yang mendasarinya baik-baik saja, maka itu adalah masalah antara kernel dan perangkat keras, yaitu lapisan virtualisasi. Anda mungkin harus meminta penyedia VPS Anda untuk mengonfirmasi bahwa distro, dan versi kernel yang tepat, yang Anda jalankan didukung sepenuhnya pada sistem VPS mereka.

MadHatter
sumber
2

Cara yang lebih sempurna untuk menemukan kesalahan sebenarnya mungkin selama periode hanya baca dan menjalankan perintah dmesguntuk setiap bug / masalah. Anda juga dapat mencoba menjalankan fsckdalam mode kering untuk mencari tahu apa masalahnya. (maaf karena pembatasan akses, saya tidak dapat melihat lampiran Anda. Jika ini selama periode masalah, saya akan memeriksanya nanti)

rootlash
sumber
Saya menggunakan dmesgperintah ketika sistem file dalam mode read-only. Sekarang saya hanya me-reboot server dan untuk saat ini berfungsi. Apa maksudmu fsck in dry mode? Saya tidak pernah menggunakan perintah ini ...
user606521
`fsck -N <partition>` Jangan mengeksekusi, tunjukkan saja apa yang akan dilakukan.
Rootlash
Saya mengedit pertanyaan dan menambahkan output darifsck -N sda
user606521
2

Saya juga menghadapi masalah yang sama, di mana server FS akan menjadi read-only. Lakukan check inode, mereka mungkin penuh:

df -i

dannydsouza0908
sumber