CPU ProCurve 100% selama beberapa menit setelah reboot

9

Saya telah melakukan peningkatan firmware pada switch HP. Dua model berbeda telah ditingkatkan:

  • ProCurve Switch 5406zl Intelligent Edge (J8697A): ditingkatkan dari K.15.06.0008 menjadi K.15.12.0012
  • HP 2520-24G-PoE Switch (J9299A): ditingkatkan dari J.14.54 ke J.15.09.0021

Memeriksa setiap sakelar tepat setelah mem-boot gambar baru, saya telah mengamati sesuatu:

  1. Switch memuat gambar firmware baru tanpa kesalahan dan konektivitas pulih segera setelah sakelar boot. Pada titik ini penggunaan CPU rendah (di bawah 10%)
  2. Beberapa detik kemudian penggunaan CPU meningkat hingga 100% dan berdiri di sana selama beberapa menit. Saya tidak dapat mendeteksi masalah apa pun pada saat ini selain dari CLI hingga SSH yang sedikit lamban: konektivitas normal, tidak ada pesan log ...
  3. Setelah lima hingga sepuluh menit pada 100%, CPU kembali normal tanpa ada perubahan dari sisi saya.

Kedua model memiliki perilaku ini. Saya memutar kembali satu unit dari masing-masing model ke gambar firmware sebelumnya dan mereka berperilaku dengan cara yang sama.

Meskipun lonjakan CPU ini tepat setelah boot tidak menyebabkan masalah, saya bertanya-tanya apakah perilaku jaringan normal bisa menjadi penyebab lonjakan ini, tapi saya rasa tidak. Saya telah mempertimbangkan aspek-aspek berikut:

  1. Tepat setelah boot, STP mulai berjalan, menghasilkan BPDU dan bersepeda semua port di sakelar melalui status Bloking, Listening, Learning, dan Forwarding. Namun, bahkan dengan 802.1D proses ini memakan waktu tidak lebih dari 1 menit dengan timer default. Selain itu, saya memeriksa sakelar melalui SSH, jadi semua perhitungan STP sudah dilakukan saat saya dapat terhubung ke sakelar.

  2. Tepat setelah boot tabel alamat MAC kosong dan siaran diperlukan untuk frame pertama yang akan diteruskan. Tapi saya ragu siaran ini akan membutuhkan 100% CPU, apalagi selama 5 menit, dalam 24 port switch.

  3. Semua sakelar bertindak sebagai perangkat L2, tidak ada fungsi L3 yang memungkinkan, jadi saya membuang proses perutean dan L3 lainnya.

Apakah saya kehilangan sesuatu yang "normal" dalam operasi jaringan yang dapat menjelaskan penggunaan CPU ini selama 5 menit setelah reboot sambil menjaga konektivitas? Mungkin itu adalah semacam proses latar belakang saklar berjalan tepat setelah reboot?

Daniel Yuste Aroca
sumber

Jawaban:

8

Ini membutuhkan waktu kurang dari 2 detik di Google: portal jaringan HP

HP ProCurve 5400zl Switch Series - Utilisasi CPU Tinggi (99-100%) setelah Masalah Permulaan

Tepat setelah sakelar dimulai, pemanfaatan CPU yang tinggi (99-100%) diamati. Larutan

Saat sakelar boot, salah satu tugas inisialisasi adalah pembuatan kunci enkripsi. Memiliki kunci yang dibuat di muka berarti nanti, ketika fitur seperti SSL atau SSH yang menggunakan kunci dikonfigurasi atau digunakan, ada sedikit keterlambatan dalam ketersediaan. Tugas ini memakan waktu beberapa detik sebelum naik, tergantung pada model sakelar, konfigurasi yang dimuat, dan revisi perangkat lunak. Meskipun tugas tersebut menghabiskan hingga 100% dari CPU, ia berjalan pada prioritas yang sangat rendah. Oleh karena itu, jika tugas lain yang memerlukan siklus CPU dimulai, tugas dengan prioritas rendah ini akan mundur. Jika tugas inisialisasi / pembangkitan kunci ini berjalan tanpa terganggu oleh tugas dengan prioritas lebih tinggi, dibutuhkan sekitar 10 menit untuk menyelesaikannya. Jika CPU sibuk dengan tugas-tugas lain, waktu penyelesaian akan diperpanjang.

Untuk memverifikasi bahwa peningkatan CPU yang dilihat sebenarnya adalah apa yang telah dijelaskan di sini dan bukan sesuatu yang lain yang memerlukan pemecahan masalah, silakan gunakan perintah yang didokumentasikan di bawah ini.

task-monitor cpu (this command was introduced in K.13.04)

show uptime

show cpu

Outputnya akan terlihat seperti berikut.

Beralih # tugas-monitor cpu Beralih # show uptime 0000: 00: 01: 42.36 Switch # show cpu

99 percent busy, from 27 sec ago
1 sec ave: 100 percent busy
5 sec ave: 100 percent busy
1 min ave: 66 percent busy

Task usage for last 5 sec
 % CPU | Description
-------+--------------------------
   0.3 | Sessions & I/O
  99.7 | System Services
Ron Trunk
sumber
Saya setuju ini sepertinya menggambarkan masalah yang saya alami. Tapi kemudian muncul pertanyaan baru di benak saya. Seperti yang saya katakan, saya cheking sakelar melalui koneksi SSH. Jika kunci SSH dibuat beberapa detik setelah saya masuk: bagaimana saya bisa memulai sesi SSH sebelum kunci siap?
Daniel Yuste Aroca
2
Dari Panduan Keamanan Akses Procurve: Saat Anda membuat pasangan kunci host pada sakelar, sakelar menempatkan pasangan kunci dalam memori flash (dan bukan pada file running-config). Selain itu, sakelar mempertahankan pasangan kunci di seluruh reboot, termasuk siklus daya. Menghapus (memusatkan perhatian) pasangan kunci publik / privat sakelar membuat sakelar tidak dapat terlibat dalam operasi SSH dan secara otomatis menonaktifkan IP SSH pada sakelar.
Daniel Yuste Aroca