Baru mulai di perusahaan baru dan salah satu tugas pertama saya adalah mencari alternatif untuk sistem pemantauan internal mereka.
Solusi mereka saat ini adalah aplikasi .Net yang memeriksa berbagai perangkat melalui WAN (karena mereka adalah perusahaan konsultan IT yang menyediakan dukungan 24/7 / "pemeliharaan"). Perangkat berkisar dari router / switch / printer ke server dan layanan MS.
Setelah membaca posting yang tak terhitung jumlahnya di situs dan googling secara luas, tampaknya konsensusnya adalah semacam campuran Nagios / Munin.
Yang membawa saya ke pertanyaan saya:
A) Apakah mungkin menjalankan server Nagios secara lokal di perusahaan dan memantau berbagai situs eksternal melalui WAN? (Mereka tidak ingin server Nagios lokal di setiap situs karena sebagian besar situs relatif kecil (10-25 host) dan jumlah situs cukup besar (75-100)).
B) Jika demikian, bagaimana agen akan menghubungi backend Nagios? Melalui SSH? HTTP?
C) Selain dari fakta bahwa itu akan rentan terhadap kegagalan sambungan-WAN, seperti apa kelemahan langsung dari solusi semacam itu?
Setiap umpan balik dihargai, dan saya minta maaf sebelumnya atas kesalahpahaman karena saya baru di industri.
sumber
Ini semacam tergantung apa yang akan Anda pantau. Sebagian besar jika Anda hanya melakukan pemeriksaan ping, pemeriksaan layanan, pemeriksaan disk, dll, dan tetap menggunakan waktu nagios selama 5 menit, saya tidak dapat melihatnya yang menyebabkan Anda mengalami masalah.
Sekali lagi, tergantung pada apa yang Anda periksa tergantung pada apa yang akan dibicarakan. Jika Anda memeriksa host windows, Anda bisa menggunakan kueri WMI dan bahkan tidak memerlukan agen yang berjalan di kotak.
sumber
Ini tentu dimungkinkan, melalui beberapa metode berbeda.
Jika "pengaturan terdistribusi" keluar dari pertanyaan, maka Anda harus melakukan setidaknya satu dari yang berikut:
Saya akan menyarankan # 3, karena membutuhkan lubang firewall paling sedikit, dan juga menyederhanakan konfigurasi. Ini semacam versi ramping dari setup terdistribusi, dalam hal itu tidak memerlukan contoh Nagios penuh di setiap situs.
Untuk melakukan ini, Anda dapat mengatur NRPE (atau menggunakan check_by_ssh ) dan meminta "proxy" ini menjalankan semua pemeriksaan lain terhadap host lain di jaringan. Ini memiliki manfaat tambahan dari data kinerja yang Anda dapatkan kembali menjadi relatif terhadap proxy, sehingga tidak akan terpengaruh oleh keterlambatan WAN.
Selain itu, Anda kemudian dapat menggunakan pengaturan induk / anak untuk menjadikan setiap host di situs remote sebagai anak dari proxy-nya, untuk mengurangi pemberitahuan positif palsu. Anda mungkin juga ingin membuat semua layanan bergantung pada layanan check_nrpe (atau check_ssh) dari proxy. Lihat dokumen jangkauan jaringan untuk info lebih lanjut.
Apa pun metode yang Anda gunakan, sangat penting bagi Anda untuk menyesuaikan batas waktu default secara tepat, untuk memperhitungkan keterlambatan tambahan melintasi tautan WAN.
sumber