dapat mengisi disk dan kemudian membebaskan ruang menyebabkan masalah sistem file sebulan kemudian?

1

Saya memiliki insiden yang terjadi belum lama ini dengan server yang menjalankan mysql. Seseorang telah mengaktifkan pencatatan permintaan lambat pada server tetapi tidak pernah repot untuk menerapkan rotasi log, sehingga file log perlahan mengisi hard drive dari waktu ke waktu sampai disk menjadi penuh dan mysql tidak lagi berfungsi dengan baik. Ketika saya pergi untuk menyelidiki, saya menemukan apa masalahnya dan jadi saya menghapus semua file log kueri lambat dan menonaktifkan pembuatan log kueri lambat. Ini menyelesaikan masalah langsung, tetapi sekitar satu bulan kemudian filesystem di server secara spontan menjadi read-only. Disk hanya sekitar 18% penggunaan saat ini terjadi, jadi disk itu hampir penuh. Saya menghubungi pusat data untuk menyelidiki kemungkinan masalah perangkat keras, tetapi mereka mengatakan perangkat kerasnya baik-baik saja dan itu hanya kesalahan sistem file.

Jadi pertanyaan saya adalah, apa yang mungkin menyebabkan ini terjadi? Bisakah disk diisi satu bulan sebelumnya telah menyebabkan beberapa jenis kesalahan filesystem yang perlahan-lahan bertambah buruk dari waktu ke waktu sampai filesystem akhirnya pergi-hanya sebulan kemudian?

PS Saya sadar bahwa saya mungkin harus lebih memperhatikan penggunaan disk di server. Saya tahu saya bisa mencegah disk agar tidak terisi jika saya melakukannya, yang merupakan kesalahan saya. Namun, saya masih penasaran untuk mengetahui apa yang menyebabkan sistem file secara spontan akan membaca - hanya sebulan kemudian. Saya menghargai umpan balik kalian dalam hal ini.

Terima kasih!

Pengguna anonim
sumber
1
Kemungkinan kedua peristiwa ini tidak saling terhubung. Apakah Anda mengalami pemadaman?
Paul
Tidak, tidak ada pemadaman. Server berjalan dengan baik antara insiden pertama dan insiden kedua. Saya baru saja masuk suatu hari dan menemukan bahwa sistem file telah menjadi read-only. Dugaan saya adalah bahwa ketika disk terisi satu bulan sebelumnya, itu mungkin telah menyebabkan beberapa jenis kesalahan sistem file yang perlahan-lahan semakin memburuk dari waktu ke waktu sampai akhirnya menyebabkan OS menempatkan sistem file dalam mode read-only untuk mencegah kerusakan lebih lanjut. Saya tidak yakin apakah ini yang sebenarnya terjadi, itulah sebabnya saya ingin tahu apa yang kalian pikirkan.
Pengguna anonim
Jika tidak ada yang terjadi, maka mungkin itu - kesalahan sistem file ada sejak log mengisi ruang. Atau bahkan sebelum itu, dan selalu ada di sana, tetapi baru saja menjadi masalah ketika file apa pun yang terpengaruh diakses. Ketika Anda melakukan perbaikan itu akan menjadi lebih jelas.
Paul
Apakah semua filesystem di server menjadi read-only, atau hanya satu? Apakah sistem file berbasis SAN, atau disk lokal? Jika Anda tahu kira-kira kapan masalah dimulai, Anda mungkin dapat menemukan alasan di / var / log / messages (tidak akan berlaku jika semua sistem file hanya dibaca karena tidak dapat menulis ke file ini).
Omnipresence