Pemantauan server produksi [ditutup]

18

Kami memiliki 3 server khusus, terbagi dalam beberapa VPS menggunakan openVZ. Kami menggunakan munin untuk memantau VPS dengan lokasi produksi, dan memonit beberapa VPS untuk memastikannya memulai kembali layanan ketika gagal.

Masalahnya adalah kita perlu cara yang jauh lebih baik untuk memantau semua server kami, karena kami memiliki hingga 14 VPS, kami ingin memiliki hub pusat di mana kami tidak hanya dapat melihat data yang dikumpulkan oleh munin, tetapi juga beberapa statistik tambahan pada jaringan dan kinerja layanan kami.

Beberapa persyaratan kami:
- Pemberitahuan SMS tentang kegagalan (kemampuan untuk menyiapkan verifikasi khusus tertentu)
- Penganalisis log untuk apache error_log dan beberapa lainnya.
- Harus terpusat (artinya satu server dan beberapa node mengumpulkan data).
- Tidak perlu mudah dipasang tetapi mudah dirawat.
- Harus gratis

Saya telah diarahkan ke nagios dan splunk, bagaimana menurut Anda? Terima kasih,

Adam Benayoun
sumber

Jawaban:

17

Saya memiliki pengaturan yang sama, kecuali dengan Xen di tempat. Saya sangat senang dengan kombinasi:

  • Nagi untuk memberi peringatan (menggunakan PNP untuk beberapa grafik lite, dan Nagviz untuk dasbor status layanan)
  • Ganglia untuk grafik historis sistem
  • OSSEC sebagai HIDS dan sama pentingnya sebagai kolektor untuk penebangan terpusat
    • sidenote: Ada plugin Splunk untuk OSSEC yang mengintegrasikan kedua alat ini dengan sangat baik, saya menunggu mereka untuk port ke Splunk v4.
  • Splunk Terakhir, setelah beberapa plugin Splunk dimigrasikan, kami berencana menggunakan Splunk dengan beberapa pra-penyaringan log (untuk menjaga agar tidak melewati batas edisi gratis)

Saya harap berbagi pengaturan pemantauan kami akan membantu Anda :-)

Berikut ini beberapa tautan bermanfaat:

http://www.ibm.com/developerworks/linux/library/l-ganglia-nagios-1/index.html

https://www.ibm.com/developerworks/linux/library/l-ganglia-nagios-2/

http://www.ossec.net/main/splunk-ossec-integration

memperbarui:

Saya lupa menyebutkan bahwa kami menggunakan tata letak konfigurasi Matt Simmons Nagios juga, ditemukan di sini http://www.standalone-sysadmin.com/blog/2009/07/nagios-config/

Tata letak ini menjadikan Nagios Configuration kami waras dan lebih mudah dirawat (Terima kasih Matt!)

pembuat kesalahan
sumber
2
+1 untuk OSSEC + splunk. mereka bekerja sangat baik bersama.
sucuri
5

Saya sudah sukses besar dengan Zabbix , itu memenuhi semua poin Anda dalam satu paket.

teks alternatif
(sumber: zabbix.com )

Bagian tersulit akan mendapatkan pemantauan log apache, tetapi Zabbix dapat dikembangkan sehingga Anda dapat menggunakan LogWatch atau skrip perl lainnya untuk mengambil data untuk Anda.

Dave Drager
sumber
2

Saya suka OpManager, dan gratis hingga sejumlah node. Apakah semua hal di atas, dan cukup mudah untuk menginstal dan memelihara.

ChickenMilkBomb
sumber
1

Nagios harus menjadi pilihan yang baik. Pertama-tama - ini modular dan memuaskan hampir semua harapan Anda. Selain itu, ia menerima beberapa penghargaan yang bagus .

Sunting: Jangan lupa untuk memeriksa jawaban ini .

minder
sumber