Bagaimana saya bisa melihat log di server setelah kernel hang panik?

10

Saya menjalankan mesin Linux produksi gentoo, dan baru-baru ini ada situasi di mana server tergantung di lokasi saya bersama dan ketika saya sampai di sana saya perhatikan bahwa server digantung pada apa yang tampaknya menjadi kernel panic hang. Saya reboot mesin dengan reboot keras dan kecewa mengetahui bahwa saya tidak dapat menemukan sedikit pun bukti di mana saja tentang mengapa mesin tergantung.

Apakah benar bahwa ketika saya melakukan reboot dengan keras, pesan-pesan itu sendiri akan hilang atau apakah ada pengaturan yang dapat saya lakukan di suatu tempat di syslog-ng atau mungkin di sysctl untuk setidaknya menyimpan log kesalahan sehingga saya dapat mencegah kecelakaan seperti itu terjadi di masa depan ? Saya menjalankan kernel 2.6.x.

Terima kasih sebelumnya.

Low Kian Seong
sumber

Jawaban:

5

Untuk mencatat panik kernel, menggunakan netconsole jauh lebih mudah daripada menggunakan tautan serial;)

Ada entri yang berguna tentang hal itu di wiki ubuntu yang dapat digunakan pada rasa linux lainnya ... Membantu saya misalnya dengan archlinux.

Perhatikan bahwa netconsole juga dapat diatur saat boot.

Vincent
sumber
4

Secara umum dalam situasi ini saya telah membuat konsol serial jarak jauh dan kemudian memastikan untuk mencatat segala sesuatu yang muncul di konsol. Anda dapat melakukan ini dengan menghubungkan port serial mesin ke komputer lain melalui kabel rs-232. Ini mungkin mendapatkan sedikit penipu akhir-akhir ini karena port serial secara bertahap menghilang, tapi saya pikir sebagian besar server masih memilikinya.

Kemudian pada mesin lain itu, jalankan conserver dan konfigurasikan logging konsol. Ini memberikan cara yang baik untuk mencatat segala sesuatu di konsol dan memberikan jalur masuk alternatif ke sistem.

Jika Anda tidak ingin mengatur dan mengelola kotak linux lain, alternatifnya adalah menginstal server konsol serial. Berbagai perusahaan seperti Avocent, Cyclades, dan Raritan membuat kotak-kotak ini yang menyediakan antarmuka jaringan ke 2-48 port serial. Namun hal semacam ini akan lebih mahal daripada hanya menyiapkan kotak linux lain saja.

Phil Hollenback
sumber
4
Selain jawaban Phil, perhatikan bahwa banyak (sebagian besar?) * Sistem NIX akan membuang kernel / RAM ke partisi swap jika terjadi kepanikan, dan menyalin dump ke /var/crashatau /var/adm/crashsetelah reboot untuk memungkinkan Anda menyerang dengan debugger dan lihat di mana kepanikan itu terjadi. Konsol serial masih merupakan opsi yang hebat, karena memungkinkan Anda melihat apa hal terakhir yang dilakukan server sebelum panic()itu.
voretaq7
0

Anda dapat mencoba mereplikasi pesan syslog ke komputer lain. Mungkin tidak semuanya tetapi hanya peringatan dan kritis dan nonaktifkan caching untuk mereka.

dtoubelis
sumber