Saya mencari cara untuk mendiagnosis masalah, seperti swap kematian, di mana proses memori baloon mengisi swap dan membunuh seluruh mesin (seperti apache).
Saya sudah menggunakan kaktus dan saya dapat mengatur nagios (meskipun lebih suka tidak) atau munin tetapi sejauh yang saya tahu mereka tidak dapat merekam penggunaan program individu - hanya status keseluruhan.
Saya tahu saya bisa menggulung skrip yang >> ke beberapa file setiap 30-an tapi saya ingin melihat apakah solusi matang yang sudah ada.
Sekali lagi, idealnya akan:
- merekam penggunaan memori proses setiap N detik
- merekam proses penggunaan CPU setiap N detik
- grafik dan riwayat dukungan
- rata-rata dukungan - seperti mysqld telah menggunakan CPU 43% pada hari terakhir dan rata-rata memori 400MB
- menjadi sumber bebas dan terbuka
Nama-nama proses tidak dan tidak harus diketahui sebelumnya - idenya adalah membiarkannya memantau dan kemudian melihat pelanggar atas.
Sistem saya adalah Linux (OpenSUSE).
linux
performance
monitoring
memory-usage
Artem Russakovskii
sumber
sumber
Jawaban:
Jika Anda hanya menginginkan pelaku teratas, pertimbangkan untuk berlari
top
dengan interval yang relatif lama (60 detik plus) dalam mode batch. Anda mungkin perlu lebih dari satutop
berlari untuk menangkap pelanggar utama pada banyak sumber. Saya telah mengkonfigurasi sistem untuk berjalantop
selama beberapa siklus ketika sumber daya sedang digunakan.Pertimbangkan berjalan
sar
dalam mode batch untuk menangkap pemanfaatan sumber daya. Saya menyadari ini berbasis server, tetapi berguna untuk menentukan waktu ketika masalah terjadi.Jalankan
munin
dan aktifkan notifikasi. Ini mungkin memberi Anda kesempatan untuk masuk dan menyaksikan server turun. Anda mungkin dapat memperbaiki masalah sebelum turun.Untuk kebocoran memori, peningkatan penggunaan swap yang stabil mengindikasikan adanya masalah. Saya pernah melihat server yang perlahan mati selama beberapa hari. Layanan masalah adalah program memantau proses lain untuk kebocoran memori. Admin sistem terus bersikeras bahwa peningkatan penggunaan swap tidak menjadi masalah, sampai server berhenti merespons.
Anda mungkin menemukan bahwa
cfengine
deteksi anomali dapat digunakan untuk memicu skrip untuk menangkap status sistem ketika ada masalah. Anda mungkin menginginkan banyak informasi selain hanya proses menggunakan sumber daya terbanyak. Untuk arus penggunaan yang tiba-tiba, Anda mungkin menginginkan daftar koneksi jaringan (berdasarkan alamat bukan nama). Penggunaan memori juga bermanfaat.sumber
sysstat dibuat cukup persis untuk tujuan Anda.
sumber
Saya telah menggunakan di atas sebelumnya:
http://freshmeat.net/projects/atop/
"Di atas adalah monitor kinerja layar penuh ASCII yang mampu melaporkan aktivitas semua proses (bahkan jika proses telah selesai selama interval), pencatatan harian sistem dan aktivitas proses untuk analisis jangka panjang, menyoroti sumber daya sistem yang berlebihan dengan menggunakan warna, dll. Secara berkala, ini menunjukkan aktivitas tingkat sistem yang terkait dengan CPU, memori, swap, disk, dan lapisan jaringan, dan untuk setiap proses aktif itu menunjukkan pemanfaatan CPU, pertumbuhan memori, prioritas, nama pengguna, status, dan keluar dari kode. "
sumber
atop -r log_filename
, tekanm
untuk beralih ke tampilan penggunaan memori per-proses, dan kemudian tekant
untuk bergerak maju dalam peningkatan 10 menit hingga jam 3:40. Anda dapat membaca lebih lanjut tentang dasar-dasar penggunaan di atas di lwn.net/Articles/387202 dan lihat contoh mengidentifikasi kebocoran memori di atoptool.nl/download/case_leakage.pdfSudahkah Anda mencoba collectd?
Ini sangat kuat dan dapat disesuaikan.
Memiliki banyak plugin dan dapat diintegrasikan dengan nagios.
http://collectd.org/features.shtml
sumber
top
.Centreon di atas Nagios, Nagios ditambah dengan NRPE. Anda kemudian dapat menulis skrip khusus untuk melaporkan data dalam format APAPUN yang Anda inginkan ke NRPE. Nagios kemudian melakukan polling data dari server jarak jauh dengan NRPE dan Centreon membuat grafik yang cantik dan menambahkan satu ton fleksibilitas pengguna. Kami menggunakannya di http://beyondhosting.net. Saya memiliki template VZ Container dengan pengaturan centreon + nagios jika Anda menginginkannya.
Grafik centreon membangun hostthenpost.org/tyler/2010-07-23_1719.png
sumber
nmon adalah alat hebat yang melakukan apa yang Anda cari. Dikembangkan untuk AIX dan Linux. Menghasilkan satu ton detail output dan mudah dimasukkan ke dalam laporan. Jika Anda google, ada wiki IBM yang memiliki banyak dokumentasi dan utilitas tambahan untuk mengurai data.
sumber
Server Density melakukan persis apa yang Anda gambarkan.
Saya menggunakannya di salah satu server produksi kami dan saya sangat senang karenanya. Fitur utamanya adalah kemampuan untuk melihat grafik, klik pada suatu puncak dan melihat konsumsi CPU / Memori server pada saat itu, termasuk semua proses yang berjalan. Mereka menyebutnya snapshots .
Terus membaik. Salah satu fitur terbaru adalah deteksi anomali , yang memungkinkan Anda mendeteksi anomali dengan mudah. Anda juga dapat mengatur berbagai treshold
sumber
http://studyhat.blogspot.com/2010/08/user-activity-view-processes-display.html
telah melihat di atas tautan kode kecil yang memberikan Anda cpu memori dll.
sumber
Jawabannya disarankan ketika saya mengajukan pertanyaan serupa :
Icapan berkata :
David Spillet berkata :
Anda juga dapat memeriksa Nagios atau OpenNMS .
sumber
Munin akan melakukan semua yang Anda butuhkan di luar kotak tanpa memerlukan nagios atau alat lainnya. Ada RPM yang tersedia untuk OpenSUSE.
sumber
Mungkin OProfile tua yang baik melakukan apa yang Anda butuhkan? Ini adalah profiler tingkat sistem berbasis kernel dengan hanya sedikit (beberapa persen) overhead.
Lalu ada skrip Perl yang sangat bagus, PSMon , yang memungkinkan Anda mengatur semua jenis batas CPU / memori. Jika itu terlampaui, psmon akan mencatat kesalahan dan / atau membunuh proses yang menyinggung.
Yang terakhir tidak akan menghasilkan laporan profiling kepada Anda, tetapi jika memutuskan untuk membunuh proses yang sama berulang-ulang, Anda mungkin telah menemukan bajingan jahat yang Anda cari. :-)
sumber