Apakah port switch Cisco saya buruk?

9

Saya telah mengejar masalah packet-loss dan stabilitas jaringan untuk beberapa pengguna akhir di jaringan internal selama beberapa hari terakhir ... Masalah-masalah ini muncul minggu lalu, namun lokasi itu disambar petir enam minggu lalu.

Saya melihat hilangnya paket 5-10% antara tumpukan empat Cisco 2960 dan beberapa PC dan ponsel di sisi lain dari lari 77 meter. PC dijalankan sejalan dengan telepon melalui tautan trunk ( konfigurasi switchport pastebin ). Kami melihat panggilan terputus dan gangguan dalam aplikasi server klien dan konektivitas Microsoft Exchange.

Saya mencoba langkah pemecahan masalah yang biasa dari jarak jauh, meminta teknisi lokal melakukan hal berikut selama jeda dalam aktivitas pengguna dan produksi:

  • ganti kabel antara soket dinding dan perangkat.
  • ganti kabel patch antara panel patch dan sakelar port.
  • coba berbagai port sakelar dalam tumpukan 2960.
  • mengubah perangkat pengguna akhir dengan peralatan yang dikenal baik (telepon baru, PC yang berbeda).
  • hapus penghitung antarmuka port switch dan pantau kesalahan yang bertambah dengan cermat. ( Output Pastebin darish int )
  • Memilah - milah log perangkat dan grafik RRD Observium . Tidak ada masalah tautan naik / turun dari sisi sakelar.
  • ganti strip daya di sisi pengguna akhir.
  • kabel uji beroperasi dari Cisco 2960 menggunakan test cable-diagnostics tdr int Gi4/0/9(bersih) *
  • kabel uji beroperasi dengan penguji kabel Tripp-Lite. (bersih)
  • jalankan diagnosa pada switch stack anggota. (bersih)

Pada akhirnya, butuh tiga perubahan port switch untuk menemukan solusi yang stabil. Satu-satunya kesimpulan logis adalah bahwa beberapa port switch Cisco 2960 buruk atau terkelupas ... Tidak mati, tetapi juga tidak konsisten dalam perilaku. Saya tidak terbiasa melihat port individual mati dengan cara ini.

Apa lagi yang bisa saya uji atau periksa untuk menentukan apakah perangkat ini buruk?

Apa pendekatan praktik terbaik untuk memverifikasi ini?

Apakah umum untuk port tunggal mengalami masalah, bukan bank port yang berdekatan?


BTW - show cable-diagnostics tdr int Gi4/0/14sangat keren ...

Interface Speed Local pair Pair length        Remote pair Pair status
--------- ----- ---------- ------------------ ----------- --------------------
Gi4/0/14  1000M Pair A     79   +/- 0  meters Pair B      Normal              
                Pair B     75   +/- 0  meters Pair A      Normal              
                Pair C     77   +/- 0  meters Pair D      Normal              
                Pair D     79   +/- 0  meters Pair C      Normal              
putih
sumber
Bisakah Anda menambahkan "show interface gi4 / 0/9" ... juga output tdr Anda dari gi4 / 0/14 ... berapa banyak port yang mengalami masalah?
Mike Pennington
@MikePennington 4 interface dari 48 menunjukkan masalah. Penghitung telah dibersihkan. Tapi satu-satunya penghitung yang bertambah adalah:Total output drops: 1461
ewwhite
1461 turun dari total berapa banyak paket output? Apakah keempat port masalah menunjukkan penurunan output?
Mike Pennington
Output pastebin @MikePennington Interface untuk dua port bermasalah.
ewwhite
1
Bukan jawaban teknis tapi .. apakah Anda memiliki kontrak TAC aktif? Jika ya, libatkan: P
ItsGC

Jawaban:

7

Sementara bank pelabuhan sering berbagi ASIC, masing-masing harus memiliki PHY tersendiri. Jika PHY telah rusak itu bisa sangat bermasalah sementara tetangganya tidak.

Yang mengatakan, penurunan output adalah gejala aneh untuk masalah fisik - bukan tidak mungkin, tetapi tidak khas. Meskipun setengah duplex link, penurunan output biasanya lebih berkaitan dengan kelelahan buffer daripada masalah fisik.

Anda dapat memperoleh informasi lebih lanjut dengan mengatur pengambilan paket di sisi lain kabel. PHY yang buruk diharapkan bermanifestasi dengan sejumlah kesalahan lapisan fisik (CRC buruk, runt / raksasa, dll) pada satu atau kedua sisi tautan.

Semua dalam semua itu terdengar seperti Anda sudah cukup dieliminasi sehingga mungkin melewati titik pengembalian yang semakin berkurang. Saya akan merekomendasikan RMA jika Anda memiliki kontrak.

rnxrx
sumber
Karena ini terjadi pada beberapa port pada beberapa (2) switch, tetapi hanya untuk sebagian kecil pengguna, apakah ini kasus di mana saya harus mengganti keempat switch? Saya hanya mengalami kesulitan melobi pengganti tanpa mengetahui inti masalahnya, karena penggantian akan membutuhkan banyak waktu henti, pemulihan kembali, dll.
ewwhite
Petir adalah hewan yang sangat aneh dan kerusakan darinya dapat bermanifestasi jauh di kemudian hari dan dengan cara yang tidak terduga. Downtime menyebalkan, tentu saja, tetapi bisa diperbaiki sedikit dengan memutar saklar pengganti, memindahkan patch dan kemudian menarik yang lama keluar. Saya berharap ada jawaban yang lebih mudah, tetapi jika Anda telah mengisolasi masalah ini ke beberapa port maka tidak ada banyak lagi yang harus dilakukan.
rnxrx
PHY hampir selalu terintegrasi ke dalam ASIC hari ini. Ini jelas lebih murah. Magnet adalah tentang satu-satunya bagian yang benar-benar tidak dapat diintegrasikan ke dalam ASIC, yang dapat rusak, tetapi itu bukan PHY. Selain itu, cukup umum untuk menggunakan magnet set Quad, jadi jika masalahnya ada pada 4 port, gunakan teori ini.
Chris S
Tidak juga - jika Anda melihat arsitektur sebagian besar switch Cisco (termasuk yang dipertanyakan) ASIC yang sama sering digunakan untuk satu atau dua serat atau tembaga GE atau pengelompokan 100TX. Lebih banyak fungsi yang dipindahkan ke ASIC dalam arsitektur switch-on-chip tetapi dalam kasus-kasus tersebut masih ada lapisan fisik yang ditangani oleh optik pluggable atau semacam media tembaga. Mengingat bahwa kompleks ASIC yang sama sering dapat menangani sejumlah kebutuhan kecepatan dan daya yang berbeda, tidak masuk akal untuk mengintegrasikan fungsi ini ke putaran yang sama?
rnxrx
Akhirnya diganti semua sakelar setelah terlalu banyak port yang terdegradasi hingga tidak dapat digunakan lagi. Akhirnya, gunakan yang baik untuk SmartNet!
ewwhite
2

Ya, satu port bisa saja buruk, tetapi seingat saya, Anda harus mengganti seluruh modul. (Peringatan: sudah lama sejak saya melakukan pekerjaan signifikan Cisco ...)

Saya tidak yakin apakah itu dapat membantu, tetapi periksa FITB , oleh Laurie Denness, salah satu insinyur Ops di Etsy.

gWaldo
sumber