Untuk daftar alat pemantauan yang lebih komprehensif dan fitur-fiturnya, lihat halaman Wikipedia ini .
Seperti yang dinyatakan dalam pertanyaan, alat apa yang paling umum digunakan untuk tugas ini dan apa kekuatan dan kelemahannya?
monitoring
voretaq7
sumber
sumber
Jawaban:
Saya telah menggunakan Nagios di masa lalu dengan sukses. Sangat mudah dikembangkan (lebih dari 200 add-on), relatif mudah digunakan dan banyak laporan. Negatif akan menjadi pengaturan awal.
sumber
Cacti adalah antarmuka berbasis web yang sangat bagus untuk RRDTool , memberikan grafik dan statistik yang sangat berguna. RRDTool adalah bagian yang mengumpulkan data dari berbagai sistem dan memonitor berbagai data teknis.
Kami menggunakan solusi cacti / RRDTool untuk memantau sistem Unix dan Windows. Kami mendapatkan banyak metrik yang berguna termasuk beban, penggunaan CPU / RAM, ruang HD, pengguna yang masuk, lalu lintas jaringan, proses yang berjalan, dan sebagainya.
Anda akan menemukan informasi lebih lanjut tentang kaktus di bagian Apa itu Kaktus? halaman.
sumber
Secara pribadi, saya suka Munin yang sangat mudah untuk menginstal dan menulis plugin karena memiliki arsitektur yang sangat mudah. Ada cukup banyak plugin yang sudah ada untuk semua tujuan yang dapat Anda bayangkan, jadi Anda mungkin tidak perlu lagi menulis plugin.
Ini juga menyediakan grafik yang indah dan opsi untuk mengkonfigurasi peringatan (sangat mendasar).
sumber
Zabbix . Ini open-source, dan cukup mudah untuk diatur dan dikustomisasi. Kami memiliki banyak skrip pemantauan khusus yang mengumpan ke server zabbix, tetapi kami harus memusatkan data tersebut, menampilkannya dengan tepat, pemberitahuan (email, IM, SMS, twitter, dll), dan sebagainya.
sumber
Saya telah melakukan peluncuran Spiceworks di perusahaan kami dan kami menemukan itu menjadi alat yang hebat tidak hanya untuk memonitor server tetapi semua hal lain di jaringan.
Ia melakukan hal-hal seperti inventaris otomatis dan pemantauan khusus untuk mengirim Anda email ketika ada masalah (EG: Printer turun hingga 10% dari tinta atau hard drive server ini memiliki 20%).
Kelemahannya mungkin adalah kepadatan informasi per komputer, jangan salah ia memiliki BANYAK data per mesin tetapi untuk hal-hal seperti server di mana Anda mungkin ingin banyak statistik Anda mungkin perlu menggunakan alat lain.
EDIT: oh apakah saya menyebutkan model bisnisnya didasarkan di sekitar itu gratis selamanya.
sumber
Smokeping tidak hanya memeriksa ketersediaan berbagai server dan layanan tetapi juga melacak latensi mereka sambil memberikan kemudahan penggunaan, tampilan yang bagus, dan grafik tampilan yang cepat .
Berbagai macam plugin pengukuran latensi tersedia di luar kotak. Jika Anda mengenal beberapa Perl, mudah untuk membuatnya sendiri untuk kebutuhan eksotis.
Instalasi besar akan mendapat manfaat dari Sistem Master / Slave untuk pengukuran terdistribusi.
Sistem peringatan yang sangat dapat dikonfigurasi akan membantu Anda melihat masalah sebelum mereka mulai mempengaruhi pengguna atau berevolusi menjadi pemadaman besar.
Smokeping adalah Perangkat Lunak OpenSource gratis dan ditulis dalam Perl oleh Tobi Oetiker, pencipta MRTG dan RRDtool
sumber
OpenNMS digunakan di mana saya bekerja untuk memantau lebih dari seribu mesin Linux. Kami memantau perangkat keras masing-masing mesin dan aplikasi yang menjalankannya.
sumber
Zenoss Core ada gunanya, Kami menggunakannya (sekitar satu tahun) untuk pemantauan server yang ringan, sakelar bersih, dan UPS.
sumber
Nagios luar biasa karena gratis dan ada banyak plugin untuk itu. Namun UI dan konfigurasi sangat sulit.
Ini kebalikan dari pro / kontra yang juga hebat adalah Microsoft System Center Operations Manager (SCOM) yang tidak gratis, memiliki lebih sedikit plugin tetapi pengaturan dan konfigurasi yang brilian dan mudah.
Saya harus mengakui jika saya berada di sebuah perusahaan Microsoft terutama, memiliki persyaratan ketergantungan yang sangat tinggi (yaitu tidak mampu untuk memantau untuk istirahat) atau harus berpikir tentang membuat pengembang untuk bekerja dengannya maka SCOM akan menjadi rekomendasi saya atas Nagios.
sumber
Saya telah menggunakan:
sumber
Kami menggunakan AlertFox sejak beberapa minggu dan sangat senang. Ini tidak hanya memeriksa waktu kerja dan kinerja kami, tetapi juga memantau keranjang belanja, login pengguna, dan bagian penting lainnya dari situs web melalui skrip transaksi (berbasis iMacros).
Untuk pemantauan internal kami (ruang disk, dll.) Kami menggunakan Nagios .
sumber
Monitor Jaringan PRTG - tidak dapat mengatakan cukup banyak hal hebat tentang itu. Web front end yang luar biasa dan sangat bagus untuk memonitor router (bandwidth dll) dan perangkat lain melalui SNMP dan mengukur uptime untuk SLA, dll.
www.paessler.com
sumber
Sebagai orang Windows, MOM. Kami mencari untuk meningkatkan ke System Center Operations Manager (SCOM) tetapi tidak perlu sampai kami mulai menggunakan Windows 2008.
sumber
Saya bagian dari proyek peningkatan pemantauan operasional. Kami memiliki berbagai vendor yang datang untuk menyajikan beberapa sistem dolar besar dan dicampur dalam beberapa alternatif yang lebih murah untuk dibandingkan.
Salah satunya adalah Hyperic , yang juga tersedia sebagai solusi open source gratis. Saya terkesan dengan kemampuan yang diberikan dan ekstensibilitas untuk agen kustom.
sumber
Untuk memantau statistik (penggunaan memori, memuat, aktivitas mysql, aktivitas apache, dll.) Saya menggunakan Munin . Di luar kotak itu sudah melacak banyak hal dan plot grafik untuk interval waktu yang berbeda (24 jam terakhir, 7 hari terakhir, bulan lalu, tahun lalu). Melalui plugin, lebih banyak hal dapat dipantau. Outputnya adalah halaman HTML dengan grafik cantik.
Munin memiliki arsitektur master / node: node mengumpulkan statistik di server dan master menyimpan data dan menghasilkan HTML dan grafik.
Saya menggunakan Monit untuk melacak proses yang berjalan dan untuk me-restart atau mengingatkan saya ketika kondisi yang dapat dikonfigurasi tertentu muncul (beban cpu tinggi, penggunaan memori tinggi, tidak ada respons HTTP, dll.) Monit juga dapat memantau hal-hal yang lebih umum tentang server, seperti cpu memuat, penggunaan memori, status harddisk atau penggunaan disk.
Monit perlu dikonfigurasi untuk setiap layanan atau perangkat keras yang ingin Anda pantau dan bagaimana merespons ketika terjadi kesalahan. Opsi yang paling banyak digunakan adalah tidak melakukan apa-apa, mengirim email peringatan atau memulai kembali layanan.
Monit bagus ketika berfungsi, tetapi terkadang gagal untuk memulai, menghentikan atau memulai kembali layanan dan tidak ada banyak informasi diagnostik yang tersedia untuk memberi tahu Anda apa yang salah. Ini berarti Anda tidak tahu apakah masalahnya dengan layanan Anda atau dengan konfigurasi Monit, yang berjalan dengan lingkungan minimal seperti cron.
Kedua alat tersedia secara default di sebagian besar distribusi Linux.
sumber
Saya terkejut tidak ada yang menyebutkan logwatch atau logcheck untuk server linux - menghemat satu ton waktu membaca log !!
sumber
Saya menggunakan Pingdom untuk memonitor server saya. Ini mengirim saya pesan SMS ketika server tidak dapat dijangkau.
sumber
Proyek kami menggunakan Ganglia untuk 100+ kelompok simpul kami. Salah satu alasan kami menggunakannya adalah karena alat pemantauan yang datang dengan Rocks .
Sangat penting bagi kita untuk memiliki overhead yang sangat rendah pada setiap node sehingga sumber daya sebanyak mungkin tersedia untuk perhitungan. Ganglia memberi kami gambaran umum yang baik tentang cluster dan memungkinkan kami untuk menelusuri setiap node jika diperlukan. Selain tahu apa yang sedang terjadi saat ini, kita bisa melihat apa yang terjadi selama satu jam, hari, minggu, bulan, dan tahun terakhir. Grafik berbagai statistik adalah dasar dan fungsional.
sumber
Itu semua tergantung apa yang Anda maksud dengan "monitor"!
sumber
Peserta baru di lokasi untuk bersaing dengan Cacti dan solusi berbasis RRDTool adalah Graphite ( http://graphite.wikidot.com/ )
RRDTool diganti dengan toko dukungan yang disebut Whisper. Dokumen memberikan gambaran yang cukup bagus tentang mengapa itu berbeda dan saya sangat suka CLI untuk grafik ad hoc ketika menyelidiki sesuatu.
sumber
Kami menggunakan (dan menyukai) WhatsUp dari Ipswitch untuk jaringan Windows kami yang relatif kecil. Mudah diatur, dan relatif mudah dikelola, serta tahu cara menangani server Windows serta hal-hal standar.
Untuk jaringan yang lebih besar, jaringan yang tidak berorientasi Windows, atau jaringan dengan banyak hal yang bervariasi, saya sungguh-sungguh merekomendasikan OpenNMS . Perangkat lunak OpenNMS jika gratis dan perusahaan lebih dari senang untuk menjual dukungan dan layanan implementasi. Itu juga kebetulan dijalankan oleh teman saya yang sangat tajam dari perguruan tinggi!
sumber
Bagi mereka yang tidak suka antarmuka web Nagios ada NPC , sebuah plugin untuk Cacti yang membuat Nagios UI tersedia dari dalam Cacti, tetapi dengan tampilan yang lebih baik (ajax dll.).
Bunyinya dari database yang disediakan oleh NDO2DB , yang merupakan cara terbaik untuk memiliki infrastruktur Anda tersedia dari dalam database untuk digunakan dalam skrip dan alat lainnya.
sumber
Saat ini kami menggunakan PRTG dari Paessler . Ini luar biasa. Tidak diperlukan agen, antarmuka web Ajax yang luar biasa, pencatatan historis, grafik, WMI, dll. Ada versi 10 sensor yang tersedia secara gratis, tetapi kami merobohkan beberapa grand untuk versi perusahaan. Uang dibelanjakan dengan baik.
sumber
Hobbit - ini adalah versi Big Brother yang lebih cepat dan lebih baik (yang tampaknya sangat komersial akhir-akhir ini).
http://hobbitmon.sourceforge.net/
sumber
Jika Anda terburu-buru dan ingin alat cepat untuk memonitor server MS Anda kemudian gunakan monitor kinerja untuk windows, buat log penghitung dengan templat pemantauan khusus dan jadwal custome (mis: mengumpulkan data selama 5 menit setiap jam). Kemudian unduh Microsoft LogParser dan Codeplex's Performance Analysis of Logs (PAL) Tool ( http://pal.codeplex.com/ ) untuk menghancurkan log penghitung Anda. PAL akan menghasilkan laporan terdokumentasi yang bagus dengan tautan ke kemungkinan dokumen / alat penyelesaian masalah.
sumber
Saya menggunakan kombinasi Solarwinds, tab kinerja server VMware, dan skrip khusus.
Solarwinds Orion Network Performance Monitor adalah apa yang saya gunakan dengan sistem Windows kami. admin di server web saya. Masih menjalankan beberapa metrik aplikasi yang berguna, tetapi ia memiliki informasi bagus tentang hal-hal tingkat kotak dasar (disk, jaringan, CPU).
Untuk tamu VMware saya, saya suka tab kinerja.
Untuk server Sun saya, ketika saya membutuhkan sesuatu yang tidak tersedia di Solarwinds (karena admin kami belum menambahkannya atau apa), saya menulis skrip khusus (biasanya dalam Perl) untuk memantau hal-hal seperti kesehatan cermin, penggunaan swap, dll.
Saya ingin mendapatkan lebih banyak ke Solarwinds, tetapi hanya ada sekitar 26 jam dalam sehari (atau jadi bos saya percaya) jadi saya menemukan itu bisa sedikit membatasi ...
sumber
Kami menggunakan OpsView , yang berjalan di atas Nagios. WebUI membantu kami menggunakan definisi monitor host baru tanpa harus mengizinkan akses SSH, memberikan pandangan publik, dan mencatat nilai historis. Ini berguna untuk membuat dan menentukan baseline yang cocok.
sumber
Zabbix ( http://www.zabbix.com ) juga bagus dan lebih mudah diatur daripada Nagios.
sumber
Maaf untuk mengatakan tetapi saya akhirnya menggunakan banyak skrip khusus. Meskipun jauh dari ideal, saya ragu ada solusi yang lebih umum.
sumber
Kami telah menulis perangkat lunak pemantauan kami sendiri. Kode kami hampir tidak secanggih paket komersial, tetapi kami tidak membutuhkan banyak fungsionalitas. Lebih mudah menulis sendiri daripada menyelidiki paket lain dan belajar cara menggunakannya. Kode melakukan apa yang kita inginkan dan mudah diperluas.
sumber