Sebagai bagian dari server penyedia kami menjalankan HP Insight Diagnostics untuk menguji perangkat keras. Ini adalah proses manual. Adakah cara mengotomatiskan jalannya Insight Diagnostics?
Ada perangkat lunak hpdiags dengan opsi "-rd:" "Jalankan diagnosis dari semua perangkat yang dapat didiagnosis." Dari pengujian saya ini tidak banyak membantu (hanya membaca info SMART dari disk). Adakah yang lebih beruntung dengan itu?
Perangkat keras: BladeCenter c7000 dengan blade HP ProLiant BL460c, DL360s.
OS: ESXi dan Ubuntu.
hardware
hp
hp-proliant
automated-testing
Mark Wagner
sumber
sumber
I updated the ticket with the requested info
- Itu membuatku tertawa. Ini bukan helpdesk.Jawaban:
Jadi, saya akan mengajukan pertanyaan lain:
Mengapa perlu menjalankan diagnostik perangkat keras HP Insight di server sebelum melakukan penyediaan?
Dalam komentar saya di atas, saya menunjukkan bahwa ada sedikit keuntungan dengan melakukan ini di lingkungan HP ProLiant besar. Saya harus mengklarifikasi pemikiran saya tentang itu ...
Untuk frekuensi yang menurun, mari kita lihat jenis masalah yang biasanya Anda temui:
Array penyimpanan dan disk : Pengontrol RAID akan melapor ke OS, log, SNMP, email, ILO dan menyalakan lampu cantik untuk menunjukkan kesehatan.
RAM : Proses POST akan mendeteksi status RAM, serta sistem yang melapor ke OS, log, SNMP, email, ILO dan menyalakan indikator LED pada panel depan System Insight Display (SID) . Juga, saya bukan penggemar proses burn-in RAM karena deteksi kesalahan sistem ini sudah kuat.
Thermal dan kipas : Suhu server dan kecepatan kipas diatur oleh ILO. Ada 30+ sensor suhu pada sistem ini , sehingga sistem pendinginnya sangat efisien. Ini masih melaporkan ke OS, log, SNMP, email dan pada SID.
Catu Daya : Status PSU dilaporkan ke OS, log, SNMP, email dan pada SID, serta lampu indikator aktual pada unit catu daya yang sebenarnya.
Kesehatan keseluruhan : Ini mudah dinilai dari pandangan sekilas dengan tampilan SID, selain LED Kesehatan Internal dan Kesehatan Eksternal. Ini juga dilaporkan ke log server, SNMP, email dan ILO.
Saya tidak dapat memikirkan kondisi apa pun yang akan ditemukan pra-penempatan yang tidak / tidak dapat dilaporkan selama runtime atau pasca pemasangan OS.
Putaran diagnostik biasanya tidak akan menemukan apa pun ketika dijalankan pada sistem tanpa masalah yang jelas sebelumnya. Ini terutama karena server perlu POST dan boot ke utilitas atau firmware Penyediaan Cerdas untuk menjalankan utilitas.
Dengan kata lain, setiap item yang akan menjadi "SPOF" serius untuk server mungkin akan mencegah sistem dari menjalankan diagnosa sendiri.
Item kegagalan yang paling umum masih cukup kuat; disk harus dalam RAID dan hot-swappable. Kipas dan catu daya juga dapat ditukar dengan panas. RAM Anda memiliki ambang ECC dan ada opsi cadangan online untuk sebagian besar platform ProLiant. Tidak ada yang dapat Anda lakukan untuk menyebabkan kegagalan pada komponen ini dengan menjalankan diagnostik. Tambahkan fakta bahwa Anda menggunakan enklosur Blade HP C7000, yang memiliki redundansi internal , dan insiden kegagalan Anda harus sangat rendah.
sumber