Ini telah terjadi pada saya sudah dua kali dalam beberapa hari server saya benar-benar mati, yang berarti http, ssh, ftp, dns, smtp, pada dasarnya SEMUA layanan berhenti merespons, seolah-olah server telah dimatikan, kecuali masih merespons ping , itulah yang paling membuatku bingung.
Saya memang memiliki beberapa skrip php yang menyebabkan beban besar (cpu dan memori) pada server dalam semburan singkat, yang digunakan oleh sekelompok kecil pengguna, tetapi biasanya server "bertahan" dengan sangat baik untuk semburan ini, dan ketika turun itu tidak pernah bertepatan dengan puncak seperti dalam penggunaan (saya tidak mengatakan itu tidak dapat dikaitkan, tetapi itu tidak terjadi setelah itu).
Saya tidak meminta Anda untuk secara ajaib dapat memberi tahu saya penyebab utama dari crash ini, pertanyaan saya adalah: apakah ada satu proses yang kematiannya dapat menyebabkan semua layanan ini turun secara bersamaan? Yang lucu adalah bahwa semua layanan jaringan turun, kecuali ping. Jika server memiliki 100% dari CPU dimakan oleh beberapa proses, itu tidak akan menanggapi ping juga. Jika apache macet karena (misalnya) skrip php yang rusak, itu akan mempengaruhi http saja, bukan ssh dan dns .... dll.
OS saya adalah Cent OS 5.6
Yang paling penting, setelah me-reboot server, log sistem apa yang harus saya lihat? / var / log / messages tidak mengungkapkan sesuatu yang mencurigakan.
sumber
malloc()
1GB ram sebenarnya tidak berarti Anda akan menggunakannya, sehingga manajer memori melacak berapa banyak memori yang dipikirkan oleh program Anda dan berapa banyak memori yang diperlukan. Program sebenarnya telah digunakan, dan itu benar-benar berfungsi dengan baik, sebagian besar waktu. Setidaknya, hingga lebih dari satu program benar-benar ingin menggunakan semua 1GB yang menurutnya sudah ada.Biasanya, ini adalah masalah subsistem I / O atau disk. Sering kali, ini akan digabungkan dengan rata-rata beban sistem yang sangat tinggi. Sebagai contoh, sistem yang diperinci dalam grafik di bawah ini menjadi tidak responsif (belum dapat ping) ketika skrip berjalan serba salah, mengunci banyak file dan beban naik menjadi 36 ... pada sistem 4-CPU.
Layanan yang berjalan dalam RAM dan tidak memerlukan akses disk terus berjalan ... Dengan demikian, tumpukan jaringan (ping) naik, tetapi layanan lain berhenti ketika akses disk diperlukan ... SSH ketika kunci direferensikan atau diperlukan pencarian kata sandi. SMTP cenderung ditutup ketika rata-rata memuat mencapai 30 atau lebih ...
Ketika sistem dalam keadaan ini, coba remote
nmap
terhadap IP server untuk melihat apa yang terjadi.Pencatatan Anda mungkin tidak berfungsi jika ini masalah disk atau penyimpanan ...
Bisakah Anda menjelaskan pengaturan perangkat keras? Apakah ini mesin virtual? Apa tata letak penyimpanan?
Lebih dari sekadar pencatatan, Anda ingin melihat apakah Anda dapat membuat grafik kinerja sistem dan memahami kapan ini terjadi. Lihat apakah ini berkorelasi dengan aktivitas tertentu.
sumber