Apa yang menyebabkan penurunan total output pada antarmuka sakelar cisco?

16

Saya memiliki sasis blade HP c7000 yang berisi switch Cisco 3120X dan Cisco 3120G yang menjalankan ios 12.2 (58) SE1. Bilah-bilah itu sendiri dimuat sangat ringan namun banyak antarmuka pada sakelar-sakelar blade yang berbeda dalam sasis menunjukkan jumlah penurunan keluaran yang cukup tinggi. Jika saya memeriksa jumlah output turun berulang-ulang saya tidak hanya melihat penghitung meningkat tetapi kadang-kadang menurun. Angka-angka tidak berkorelasi dengan paket-paket yang direkam pada antarmuka. Pengaturan QoS adalah default untuk platform.

Sampel-sampel berikut semuanya diambil dalam periode 30 detik:

bc1019-3120-stack> sh int gi2 / 0/7 | i output turun
  Input antrian: 0/75/0/0 (ukuran / maks / tetes / siram); Total output turun: 2255550
bc1019-3120-stack> sh int gi2 / 0/7 | i output turun
  Input antrian: 0/75/0/0 (ukuran / maks / tetes / siram); Total output turun: 2255550
bc1019-3120-stack> sh int gi2 / 0/7 | i output turun
  Input antrian: 0/75/0/0 (ukuran / maks / tetes / siram); Total output turun: 2255550
bc1019-3120-stack> sh int gi2 / 0/7 | i output turun
  Input antrian: 0/75/0/0 (ukuran / maks / tetes / siram); Total output turun: 2255550
bc1019-3120-stack> sh int gi2 / 0/7 | i output turun
  Input antrian: 0/75/0/0 (ukuran / maks / tetes / siram); Total output turun: 2255550
bc1019-3120-stack> sh int gi2 / 0/7 | i output turun
  Input antrian: 0/75/0/0 (ukuran / maks / tetes / siram); Total output turun: 2255550
bc1019-3120-stack> sh int gi2 / 0/7 | i output turun
  Input antrian: 0/75/0/0 (ukuran / maks / tetes / siram); Total output turun: 451110
bc1019-3120-stack> sh int gi2 / 0/7 | i output turun
  Input antrian: 0/75/0/0 (ukuran / maks / tetes / siram); Total output turun: 451110
bc1019-3120-stack> sh int gi2 / 0/7 | i output turun
  Input antrian: 0/75/0/0 (ukuran / maks / tetes / siram); Total output turun: 902220
bc1019-3120-stack> sh int gi2 / 0/7 | i output turun
  Input antrian: 0/75/0/0 (ukuran / maks / tetes / siram); Total output turun: 1353330
bc1019-3120-stack> sh int gi2 / 0/7 | i output turun
  Input antrian: 0/75/0/0 (ukuran / maks / tetes / siram); Total output turun: 1804440
bc1019-3120-stack> sh int gi2 / 0/7 | i output turun
  Input antrian: 0/75/0/0 (ukuran / maks / tetes / siram); Total output turun: 1804440
bc1019-3120-stack> sh int gi2 / 0/7 | i output turun
  Input antrian: 0/75/0/0 (ukuran / maks / tetes / siram); Total output turun: 1804440
bc1019-3120-stack> sh int gi2 / 0/7 | i output turun
  Input antrian: 0/75/0/0 (ukuran / maks / tetes / siram); Total output turun: 451490

bc1019-3120-stack> sh int gi2 / 0/7 | i tingkat output
  Tingkat output 5 menit 301000 bit / detik, 119 paket / detik

1) Apakah ada hal lain yang dapat menyebabkan penurunan output selain server tidak menerima frame dengan cukup cepat?

2) Berapa jumlah maksimum output yang dapat direkam oleh penghitung antarmuka? Apakah itu tergulung saat mencapai maksimum?

3) Apa yang dianggap tingkat penurunan output yang sehat?

Pengguna123456
sumber
Seperti yang ditunjukkan oleh Leonardo Abdalla, penurunan output yang tidak menentu yang terlihat pada sasis blade kami adalah hasil dari bug CSCtq86186
User123456
Itu bug. Kami mencapai hal yang sama, ditingkatkan ke c3750e-universalk9-mz.150-2.SE4.bin dan semuanya baik-baik saja. JB

Jawaban:

14

Kecuali seseorang membersihkan counter, Anda tidak akan melihat counter tipe odometer (yang bertambah berdasarkan tindakan paket) berkurang, mereka harus selalu meningkat. Bagian itu terdengar seperti bug.

Sejauh apa yang menyebabkan penurunan produksi khususnya, ada begitu banyak penyebab yang berbeda sehingga sangat sulit untuk menentukannya dengan tepat. Terkadang ada kemacetan di dalam backplane switch dan itu mungkin muncul saat output turun pada antarmuka keluar. Dalam keadaan yang jarang terjadi, Anda juga bisa mendapatkan microbursts yang tidak muncul ketika disurvei pada interval 1 menit yang dengan cepat membebani antarmuka, tetapi kemudian turun kembali dengan sangat cepat. Saya akan menyarankan mengambil SNMP OID untuk drop output dan kemudian grafik itu dan melihat bagaimana itu sesuai dengan penghitung CLI.

Secara umum, Anda tidak ingin ada penurunan output karena mereka menunjukkan paket yang tidak membuatnya ke tujuannya. Tetapi, jika Anda menjalankan tautan Anda panas (yang Anda katakan bukan) tautan itu tidak dapat dihindarkan, sebagian besar disebabkan oleh penyangga sakelar interior, dll.

Harun
sumber
Saya bertanya-tanya apakah ada begitu banyak drop out dalam kasus ini, counter membungkus.
nos
1
Mereka adalah penghitung 32-bit, jadi Anda hampir tidak mencapai batas. (dan mungkin 64bit secara internal)
Ricky Beam
8

Pikiran pertama saya adalah banjir unicast, terutama jika penghitung bertambah serentak di sejumlah port di vlan yang sama. Saya setuju dengan Aaron bahwa penghitung meja terdengar seperti bug. Penghitung mungkin akan bergulir pada 2 ^ 64, tetapi itu tidak akan terjadi dalam hitungan detik. Saya akan mempertimbangkan tingkat output yang sehat turun menjadi nol, tetapi ini tidak realistis - bahkan di pusat data. Apakah Anda melakukan uplink 10G?

Dennis Olvany
sumber
Ya, satu uplink 10gig dari masing-masing dua 3120X dalam sasis blade (satu port diblokir karena stp)
User123456
Sama seperti uplink 1G dengan mudah akan membanjiri downlink 100M, saya yakin hal yang sama berlaku untuk 10G / 1G. Ini terutama benar ketika banjir unicast terjadi. Saya ragu banjir unicast akan terbukti dalam statistik bandwidth / pps.
Dennis Olvany
5

Sepertinya Anda menekan bug CSCtq86186. Bug ini telah ditemukan pada 3750-an, 2960-an, tetapi mungkin juga memengaruhi sakelar blade.

Leonardo Abdalla
sumber
Ini persis bug yang kami temui pada 3120-an kami - diperbaiki dalam 15.0 (2) SE. Terima kasih!
Pengguna123456
4

Jika Anda mengalami banjir unicast, menjalankan wireshark di salah satu host atau merentangkan salah satu port akan menunjukkan hal itu dengan cukup cepat.

Kedengarannya seperti Anda memiliki inti yang berlebihan dalam topologi persegi? Jika demikian, coba tambahkan perintah ini ke antarmuka vlan Anda:

arp timeout 300

Tabel CAM menahan entri selama 5 menit sementara tabel ARP disimpan selama empat jam (default). Mengatur ARP agar sesuai dengan CAM dapat menghilangkan banjir unicast dengan mengorbankan sedikit peningkatan pada CPU. Catalyst 6500/6000 Switches Masalah Tabel ARP atau CAM Pemecahan Masalah

Peter
sumber
1

Tetesan output agak umum pada sakelar yang lebih kecil dengan buffer kecil karena semburan apa pun akan menghabiskan buffer. Saya tidak terlalu terbiasa dengan 3120 jadi saya tidak dapat berbicara untuk ukuran buffernya, tapi setidaknya itu adalah alasan umum sampai mengapa orang bisa mendapatkan penurunan output.

Alasan spesifiknya adalah head of line blocking (HOLB), di mana banyak port sumber mengirim ke satu tujuan sehingga kami mendapatkan kemacetan. Alasan umum lainnya adalah ketika beralih dari kecepatan port yang lebih tinggi ke yang lebih rendah, yaitu 10G ke 1G atau 40G ke 10G.

Saya sarankan Anda menjalankan show controllers ethernet-controller X di mana X adalah port Anda. Anda harus mendapatkan beberapa informasi mengenai penurunan output, seperti jika ada sesuatu yang mencoba untuk output ke frame besar, yang bisa terjadi jika Anda tidak memiliki MTU yang konsisten di seluruh jaringan Anda.

kll
sumber