Saya memiliki server pribadi virtual kecil yang menjalankan CentOS dan www / mail / db, yang baru-baru ini memiliki beberapa insiden di mana server web dan ssh menjadi tidak responsif.
Melihat log, saya melihat bahwa oom-killer telah membunuh proses ini, mungkin karena kehabisan memori dan swap.
Adakah yang bisa memberi saya beberapa petunjuk tentang cara mendiagnosis apa yang mungkin menyebabkan insiden paling baru? Apakah mungkin proses pertama terbunuh? Di mana lagi saya harus mencari?
Saya mengalami kesulitan dengan itu baru-baru ini, karena proses yang menginjak oom-killer belum tentu orang-orang yang serba salah. Ketika mencoba mendiagnosis itu, saya belajar tentang salah satu alat favorit saya sekarang, di atas.
Utilitas ini seperti gas steroid. Selama interval waktu yang ditentukan sebelumnya, profil informasi sistem. Anda kemudian dapat memainkannya kembali untuk melihat apa yang terjadi. Ini menyoroti proses yang 80% + berwarna biru dan 90% + berwarna merah. Tampilan yang paling berguna adalah tabel penggunaan memori dari berapa banyak memori yang dialokasikan dalam periode terakhir. Itu yang paling membantu saya.
Alat yang fantastis - tidak bisa mengatakan cukup tentang itu.
di atas monitor kinerja
sumber
Ini artikel tentang penjinakan oom-Kille r terlihat sangat berguna. Sepertinya Anda dapat menetapkan prioritas untuk mencegah pembunuhan massal proses tertentu (sshd akan menjadi awal yang baik untuk VPS!)
sumber
OOM hanya mematikan proses yang memiliki penggunaan memori terbanyak saat itu. Belum tentu proses yang melampaui batas atau panggilan OOm berduri.
Linux juga lemah dengan alokasi memorinya. AKA jika proses Anda membutuhkan 5gb tetapi hanya menggunakan 3, linux akan membiarkan proses lain menggunakan 2 yang tidak digunakan. kinerja> keandalan. maka ketika p1 membutuhkan 5 penuh itu tidak bisa mendapatkannya
Bukan sebuah kutipan. hanya berurusan dengan ini sendiri dan apa yang saya temukan
sumber