Beban tinggi di server nagios - Berapa banyak layanan yang memeriksa server nagios terlalu banyak?

9

Saya memiliki server nagios yang menjalankan Ubuntu dengan Prosesor Intel 2.0 GHz, array RAID10, dan RAM 400 MB. Ini memantau total 42 layanan di 8 host, yang sebagian besar diperiksa menggunakan plugin check_http bahkan 5 menit, beberapa setiap menit. Baru-baru ini beban pada server nagios telah di atas 4, seringkali setinggi 6. Server juga menjalankan kaktus, mengumpulkan statistik setiap menit untuk 6 host.

Saya bertanya-tanya, berapa banyak layanan yang harus dapat ditangani oleh perangkat keras seperti ini? Apakah bebannya sangat tinggi karena saya mendorong batas-batas perangkat keras, atau haruskah perangkat keras ini dapat menangani 42 pemeriksaan layanan plus kaktus? Jika perangkat keras tidak memadai, haruskah saya melihat untuk menambah lebih banyak RAM, lebih banyak inti, atau lebih cepat inti? Pemeriksaan perangkat keras / layanan apa yang dijalankan orang lain?

Josh
sumber
Seperti apa tampilan ram saat ini di server? Juga seperti apa penggunaan cpu? Jika itu tinggi, proses apa yang mematoknya?
3dinfluence
Apakah Anda menyelesaikan masalah? Kami mengalami masalah yang sama. Muat avg adalah 12 ..
John

Jawaban:

7

Anda harus mencari tahu di mana kemacetan Anda ...

Saya menjalankan monitor nagios yang memeriksa 400+ host dengan http, ping, dan ssh. (bersama dengan banyak pemeriksaan pasif dan nscd lainnya)

Ini ada di server 2xQuadCore dengan 4 disk SAS di RAID10.

Saya menduga Anda memiliki pertentangan IO, karena menulis ke banyak rrds sangat tidak efisien.

Anda perlu mencari tahu proses mana yang mengambil sumber daya Anda. (kaktus, nagios, atau lainnya)

Untuk pemeriksaan IO, saya suka iotop. Instal iotop (paket 9,04 bekerja pada 8.04)

Tetapi sebaliknya top juga akan membantu Anda menemukan babi pemuatan Anda.

Kaktus satu menit sekali cukup agresif. (Saya menjalankan tambang pada interval 5m)

Salah satu pendekatan yang pernah saya dengar untuk rrd write contention adalah menempatkan rrd store Anda di ramdisk / tmpfs. (pastikan untuk menyimpan ulang bahwa sekarang dan kemudian penyimpanan persisten)

Semoga berhasil.

Joel K
sumber
Terima kasih. Saya akan memeriksanya. Mungkin kaktus yang menghasilkan beban, dan saya akan melihat apakah ada cara untuk memindahkan rrds ke tmpfs. Atau hanya menambahkan lebih banyak RAM sehingga server dapat buffer rrds. Saya khawatir jika saya menjalankan kaktus setiap 5 menit akan ada lonjakan beban yang hanya berlangsung 1 atau 2 menit yang benar-benar akan saya lewatkan ...
Josh
6

Kecuali kaktus yang menghasilkan sebagian besar beban maka Anda harus dapat menjalankan lebih banyak pemeriksaan dari pada perangkat keras Anda.

Saya menjalankan nagios pada mesin virtual FreeBSD yang berjalan di Microsoft Virtual Server pada PC lama yang lamban (Pentium 3 1GHz dengan disk PATA yang lambat). Mesin virtual hanya memiliki 128MB RAM, dan kinerja sangat buruk.

Namun rata-rata beban sekitar 0,2, menjalankan 158 pemeriksaan di 42 host.

hmallett
sumber
Terima kasih. Saya berharap saya bisa menerima kedua jawaban itu! Anda sangat membantu, ini menunjukkan kepada saya bahwa kaktus mungkin adalah pelakunya.
Josh
2

Pada PIII lama dengan 256MB RAM saya aktif memantau sekitar 230 layanan yang berbeda. Mesin yang sama juga menjalankan MRTG dan HylaFAX untuk semua faks masuk kami dan melakukannya dengan cukup nyaman.

John Gardeniers
sumber
Informasi yang sangat membantu. Ini menunjukkan kepada saya bahwa kaktus mungkin adalah pelakunya, bukan nagios. Terima kasih!
Josh
1

Anda harus dapat menjalankan muatan nagios dengan perangkat keras itu. Kami menjalankan pengaturan yang sama dengan sekitar 70 cek dan Nagiosgraph - perbedaan utama adalah RAM yang ditambahkan (murah, jadi saya akan meningkatkannya menjadi 2Gb).

Coba jalankan top atau ps -aux untuk melihat apakah CPU kelebihan beban, tapi saya ragu. Anda mungkin juga ingin memeriksa dokumen paralelisasi nagios untuk melihat apakah instalasi Anda mencoba menjalankan terlalu banyak pemeriksaan sekaligus daripada membuat cerita bersambung.

hurfdurf
sumber