Monitor perangkat keras DELL pada server VMware ESXi 5.5

11

Meskipun meneliti topik ini cukup online (jujur ​​saja, saya bukan sysadmin penuh waktu) saya tidak dapat memecahkannya.

Kami memiliki banyak server VMWare ESXi 5.5, beberapa di antaranya terintegrasi ke vSphere, beberapa di antaranya tidak (karena alasan biaya).

Semuanya menjalankan gambar ESXi standar, dengan pengecualian satu mesin yang benar-benar menjalankan gambar DELL VMWare ESXi.

Apa yang ingin saya capai tampaknya sederhana: Konfigurasikan sistem sehingga dapat ditanyakan melalui SNMP dari host jarak jauh, apakah itu snmpwalk, Nagios, PRTG, dll. Saya ingin melihat informasi dari sensor suhu, disk yang dipasang, dan statusnya. , kecepatan kipas, status PSU dll.

Saya mendapat kesan bahwa menginstal versi VMWare dari DELL akan secara otomatis mengaktifkan modul yang diperlukan (OpenManage yang paling penting), tetapi sepertinya bukan itu masalahnya.

Saya memiliki informasi yang bertentangan apakah ini bahkan mungkin sama sekali, beberapa dokumen mengatakan bahwa Anda tidak dapat meminta server DELL VMWare ESXi melalui SNMP dan Anda perlu menggunakan klien CIM. Lalu ada OMSA VIB yang bisa dipasang, dll.

Saya membayangkan ini menjadi persyaratan yang cukup umum, namun dokumen yang tersedia menarik satu ke semua arah yang berbeda.

Apakah yang saya coba lakukan mungkin (tanpa lingkungan vSphere lengkap) bahkan mungkin?

Luke yang beruntung
sumber
dengan OMSA server dell kami menjawab status lanjutan ke alat internal kami, yaitu snmp.
yagmoth555
Dan mereka menjalankan VMWare ESXi? Bisakah Anda memberi tahu saya apa sebenarnya yang Anda instal?
Lucky Luke
1
Anda perlu membuat OSMA berfungsi. itu dua file yang harus diinstal, tapi saya lupa namanya. Halaman web pada port 1311 akan berfungsi ketika addon Anda akan diinstal dengan benar
yagmoth555
1
Nah, lucu Anda mengatakan itu. Model yang harus saya uji bukan bagian perangkat keras terbaru, ini adalah PowerEdge 2970 dan setidaknya berusia 3-4 tahun.
Lucky Luke
1
Saya pergi ke halaman unduhan Dell untuk ESXi 6.0 khusus mereka ( dell.com/support/home/us/en/19/Drivers/… ) dan tentu saja, server saya yang lebih baru tetapi "entry level" tidak terdaftar dalam "Sistem yang kompatibel" "
Steve Bonds

Jawaban:

5

Ya, Anda dapat memantau ESXi Host mandiri menggunakan perangkat lunak pemantauan SNMP tetapi beberapa item hanya dapat terlihat menggunakan alat pemantauan yang mendukung protokol CIM.

Semua Host ESXi saya adalah bagian dari vCenter tetapi kami memonitornya secara langsung (menggunakan alamat IP Host vmkernal) dengan SolarWinds NPM. Ada 5 atau 6 modul CIM yang dibangun dalam ESXi 5.5 yang memberikan Anda kesehatan perangkat keras tetapi kesehatan kartu RAID bukan salah satunya. Anda perlu menambahkan Dell OMSA VIB yang menambahkan agen CIM tambahan termasuk yang untuk array RAID. Posting Brian Atkinson masih yang terbaik yang saya temukan yang menggambarkan proses,

https://communities.vmware.com/people/vmroyale/blog/2012/07/26/how-to-use-dell-dset-with-esxi

Anda hanya perlu mengikuti petunjuk untuk menginstal OMSA ESXi VIB jika Anda akan menggunakan alat pemantauan pihak ketiga yang memberikan informasi historis dan mengingatkan. Jika Anda ingin menggunakan Server OMSA Dell, Anda dapat menginstalnya dari jarak jauh pada server bare tulang, dari jarak jauh di VM atau secara lokal sebagai VM.

Anda dapat menggunakan server OMSA untuk menyambungkan ke kartu manajemen DRAC dan iDRAC Out of Band (OOB / IPMI / iLo) atau ke Host ESXi setelah Anda menginstal OMSA VIB pada Host ESXi. Anda tidak akan melihat informasi RAID Health di DRAC atau iDRAC - hanya ketika menghubungkan Server OMSA ke Host ESXi - Saya ulangi kata kunci Server sehingga tidak ada kebingungan antara Server yang bertindak sebagai klien untuk VMS OMSA yang diinstal pada ESXi Host.

Beberapa sumber daya yang bermanfaat:

Tampilkan penyedia CIM saat ini di Host ESXi https://kb.vmware.com/selfservice/microsites/search.do?language=en_US&cmd=displayKC&externalId=2053715

Tampilkan VIB yang saat ini diinstal pada ESXi Host dari CLI Host, esxcli software vib list

Anda memang melihat beberapa detail kecil kesehatan perangkat keras ketika Anda terhubung ke server vCenter versus Host ESXi secara langsung tetapi secara umum jika Anda tidak melihat kesehatan perangkat keras yang Anda cari di panel Konfigurasi / Status Kesehatan maka Anda kehilangan penyedia CIM dan Anda perlu menemukan dan menginstal VIB pada ESXi Host. Ketika Anda menambahkan Dell OMSA VIB ke ESXi Host, Anda akan melihat sensor Storage ditambahkan ke halaman Status Kesehatan yang menunjukkan volume RAID, drive, pengontrol dan kesehatan baterai untuk pengontrol penyimpanan Anda. Anda mungkin perlu mereset sensor agar muncul dan kadang-kadang dibutuhkan 15 hingga 20 menit pertama kali setelah VIB menginstal dan reboot dari ESXi Host.

Jika Anda tidak melihat sensor pada halaman Status Kesehatan Host ESXi saat Anda terhubung dengan vSphere Client, maka kemungkinan besar Anda tidak akan melihatnya ketika Anda melakukan polling sensor dari jarak jauh dengan perangkat lunak pemantauan.

Anda juga harus mencatat bahwa tidak semua server memiliki sensor yang sama dan Anda mungkin tidak bisa mendapatkan status kesehatan yang sama dari semua tergantung pada perangkat keras Server, kartu RAID dan versi CIM yang tersedia untuk kombinasi. Anda mungkin juga perlu memutakhirkan atau mengubah VIB untuk kartu RAID agar status kesehatan berfungsi. Penyedia CIM (yang merupakan OMSA VIB dalam kasus ini) berbicara ke perangkat keras melalui VIB perangkat (driver perangkat asli) dan meneruskan informasi ini ke Broker CIM di Host ESXi - juga dikenal sebagai Small Footprint CIM Broker Daemon ( sfcbd). Ketika Anda polling ESXi Host untuk kesehatan perangkat keras menggunakan perangkat lunak pemantauan yang kuat itu akan mendapatkan beberapa informasi menggunakan permintaan SNMP, beberapa menggunakan CIM dan beberapa menggunakan API ESXi (yang merupakan permintaan SOAP). Klien CIM berbicara dengan proses sfcbd pada ESXi Host.

Terkadang proses CIM berhenti bekerja. Ketika itu terjadi, Anda akan memulai kembali proses sfcbd-watchdog di ESXi Host. Ini akan memulai kembali layanan sfcbd dan polling CIM akan berfungsi lagi. Dari CLI Host,/etc/init.d/sfcbd-watchdog restart

Saya pikir itu mencakup sebagian besar item yang Anda butuhkan untuk membuat Anda berjalan.

mhughesnp
sumber
Setelah menginstal DELL VIB, saya melihat info HW tertentu sekarang di klien vSphere saat menghubungkan dari jarak jauh, luar biasa. Sayangnya itu tidak menyediakan data melalui SNMP untuk beberapa alasan, saya menduga itu tidak mungkin dan saya harus kembali ke CIM.
Lucky Luke
4

Saya mengerti apa yang Anda cari; catatan khusus tentang cara mengelola dan memantau kesehatan host VMware ESXi mandiri.

Dalam praktiknya, pendekatannya harus sedikit berbeda. Saya akan menjelaskan bagaimana saya mengelola host.

Dalam situasi di mana Anda memiliki beberapa host ESXi di bawah manajemen vCenter, asumsinya adalah bahwa Anda memanfaatkan vCenter untuk memantau dan status kesehatan , dibandingkan dengan menanyakan masing-masing host. Ada alarm tangkap semua yang saya konfigurasikan di vCenter untuk memberi peringatan pada "Host Hardware Health". Saya biasanya tidak peduli apakah itu catu daya, RAM, disk atau komponen lain, tetapi bahwa host tidak sehat.

Memantau host ESXi mandiri tidak akan sangat membantu, karena tujuan driver Dell / HP adalah untuk mengekspos informasi ke vCenter. Dan saya tidak percaya ini adalah praktik terbaik untuk menanyakan setiap host dengan cara ini. Memang, itu karena Anda secara ideal ingin host VM Anda dikelola secara terpusat.

Jika Anda menjalankan vCenter dengan satu host, Anda DO mendapatkan kemampuan ini, jadi mungkin itu pilihan untuk lingkungan Anda.

Jika Anda memerlukan semacam pemantauan out-of-band, tidak bisakah Anda meminta DRAC?

putih
sumber
Terima kasih. Kami memiliki vCenter, tetapi tidak untuk semua host. Lisensi VMWare agak aneh dan sangat mahal (saya diberitahu) setelah Anda melebihi 3 host. Jadi saya mencoba mencari cara lain untuk host yang tidak tercakup oleh vCenter. Saya harus melihat ke rute DRAC, akankah itu memberi tahu saya hal-hal seperti kegagalan RAID dll?
Lucky Luke
OSMA akan memberikan status disk, atau peringatan serangan tidak seperti DRAC.
yagmoth555
0

Anda dapat menggunakan https://exchange.nagios.org/directory/Plugins/Operating-Systems/*-Virtual-Environments/VMWare/check_vmware_api/details (dengan atau tanpa nagios), ia memanfaatkan api vmware untuk mendapatkan semua api vmware. info yang Anda perlukan untuk pemantauan perangkat keras:

check_vmware_api -H esxhost -u esx_user_read_only_role -p passwd -l runtime -s health [enter]
OK - All 450 health checks are Green 

Anda memerlukan perl vmware SDK tetapi selain itu itu cukup lurus ke depan. Ini bekerja untuk semua jenis perangkat keras (selama sensor dilihat oleh api vmware, mereka diperiksa).

natxo asenjo
sumber
-1

Coba zabbix ( http://zabbix.com ):

1) sempurna, perangkat lunak pemantauan kelas dunia yang terkenal

2) Anda dapat dengan mudah memulai dengan alat Zabbix yang tersedia juga sebagai gambar virtual pra-konfigurasi (berdasarkan OpenSuSE).

3) dapat memonitor host dan mesin ESX [I] menggunakan layanan Web Vmware (seperti klien web). Anda dapat menggunakan aturan penemuan tingkat rendah untuk secara otomatis menemukan hypervisors VMware dan mesin virtual dan membuat host untuk memantaunya, berdasarkan pada prototipe host yang telah ditentukan.

4) Anda akan dapat memonitor seluruh perangkat keras dari server Dell Anda menggunakan SNMP melalui iDrac termasuk pengontrol serangan dan status volume, cakram fisik / modul memori / PSU dan seterusnya ...

Semua jenis info status perangkat keras [seperti yang tersedia di iDrac] dapat diakses melalui SNMP (setidaknya pada server dengan IDrac 7/8 - Saya telah menerapkan pemantauan perangkat keras 50+ server generasi Dell 12/13 untuk perusahaan saya dalam hal ini cara).

Dengan fitur LLD (penemuan tingkat rendah) yang sempurna dari zabbix, Anda dapat dengan mudah mengumpulkan semua komponen perangkat keras untuk pemantauan tanpa penghitungan manual dan secara otomatis membuat item untuk pemantauan (status, suhu, kecepatan kipas, ukuran dan serial disk dan sebagainya), pemicu (ekspresi untuk memproses data pemantauan) dan berbagai tindakan ...

Sergey
sumber