Kami menggunakan Nagios untuk memantau beberapa (~ 130) server. Kami memantau CPU, Disk, RAM dan beberapa hal lain di setiap server. Saya selalu menggunakan SSH untuk menjalankan perintah jarak jauh, semata-mata karena hanya memerlukan sedikit atau tidak ada konfigurasi tambahan pada server jarak jauh, cukup instal nagios-plugins, buat pengguna nagios dan tambahkan kunci SSH, yang semuanya telah saya otomatiskan menjadi skrip shell. Saya tidak pernah benar-benar mempertimbangkan implikasi kinerja menggunakan SSH melalui NRPE.
Saya tidak terlalu peduli dengan hit beban pada server Nagios (Ini mungkin terlalu spesifik untuk apa yang dilakukannya, itu tidak pernah lebih dari 10% CPU), tapi kami menjalankan setiap pemeriksaan jarak jauh setiap 30 detik dan setiap server memiliki 5 pemeriksaan berbeda dilakukan. Saya berasumsi SSH membutuhkan lebih banyak sumber daya untuk setiap pemeriksaan tetapi apakah ada perbedaan besar? (Yaitu cukup perbedaan untuk menjamin beralih ke NRPE).
Jika ada bantuan, kami memantau campuran server fisik (Biasanya dengan 8, 12 atau 16 core fisik) dan instance Amazon EC2 menengah / besar.
Selain saran yang diberikan dalam jawaban lain, sudahkah Anda mempertimbangkan untuk mengaktifkan
ControlMaster
file .ssh / config nagios untuk memanfaatkan sepenuhnya multiplexing ssh ?Dengan kata lain koneksi SSH Anda akan 'tetap' jadi biaya overhead untuk membangunnya minimal karena ini hanya akan terjadi sekali. Ini masih akan menjamin privasi dengan enkripsi, dan melindungi Anda dari meninggalkan port TCP terbuka di server (meskipun firewall). Plus, Anda dapat membatasi apa yang dilakukan pengguna melalui ssh dengan membatasi perintah yang dapat dijalankannya
sumber
Saya tidak punya masalah selain mencoba mengkompilasi NRPE pada berbagai OS. SSH telah bekerja dengan lancar dan efisien dan jauh lebih mudah untuk dihapus.
sumber