Kami berada di uji redundansi Etherchannel dan Routing di jaringan kami. Selama intervensi ini kami melakukan beberapa pengukuran. Alat pemantauan kami adalah Cacti untuk grafik. Peralatan yang dipantau adalah 4.500-X pada VSS. Setiap tautan ada pada sasis fisik yang berbeda.
Skema:
Kronologi uji:
[t0] Tautan pada port te1 / 1/14 telah dihapus secara fisik. Te2 / 1/14 aktif. Po1 operasional.
[t0 + 15] Tautan pada Te1 / 1/14 port kembali ke layanan dan memeriksa bahwa port kembali dalam etherchannel Po1
[t0 + 20] Tautan pada port te1 / 1/14 secara fisik dihapus. Te2 / 1/14 aktif. Po1 operasional.
[t0 + 35] Tautan pada port Te1 / 1/14 kembali berfungsi dan memeriksa bahwa port tersebut kembali dalam etherchannel Po1
Dalam pengujian kami, kami memantau etherchannel Po1 lalu lintas melalui Cacti (grafik di bawah) dan melihat perubahan signifikan dalam nilai aliran ketika kami menonaktifkan tautan te1 / 1/14 (tautan aset te / 1/14) yang agak stabil selama proses sebaliknya. . Kami memeriksa juga penghitung pada int Po1 dan ini dipertahankan cukup stabil.
Dua antarmuka 10G dibundel pada Etherchannels dengan LACP dikonfigurasi. Di dalam etherchannel mereka adalah 2 vlan. Satu untuk lalu lintas Multicast dan lainnya untuk Internet / Semua Lalu Lintas.
Apakah Anda tahu kemungkinan penyebab perilaku ini?
sumber
Jawaban:
Untuk memperpanjang komentar ytti.
Interval jajak pendapat Anda tampaknya sangat kecil, setiap 10 detik jika saya membaca dengan benar. Ada beberapa alasan Anda bisa mendapatkan hasil itu.
Sisi peralatan:
Sisi Poller:
sumber
Masalah Anda adalah demikian, sehingga pengambilan sampel router dan polling Anda sendiri tidak mengenai momen yang sama. Artinya, meskipun interval pemungutan suara adalah statis, interval pemungutan suara berisi jumlah sampel yang berbeda, yang perhitungan matematika Anda tidak diperhitungkan.
Pertimbangkan Anda telah melakukan polling pada t1, t2, t3 tetapi router tidak mengambil sampel apa pun pada interval t1, t2, sehingga semua lalu lintas antara t1, t3 berakhir pada t2, nilai polling t3. Menyebabkan rate Anda menjadi 0 pada t1, t2 dan lebih linerate pada t2, t3
Sekarang saya akan menyarankan satu solusi, tapi tolong verifikasi ini dengan seseorang yang memiliki pemahaman matematika sepintas.
Antarmuka gambar pertama yang Anda minati (jika ge-1/1/1):
Maka Anda akan melihat nomor ifIndex-nya, mari kita asumsikan '42'.
Kemudian lakukan sesuatu seperti:
Sekarang menganalisis hasil untuk menentukan seberapa sering rata-rata counter benar-benar diperbarui. (Saya dapat menghasilkan skrip untuk analisis jika diperlukan)
Kemudian muncul bagian di mana kita membutuhkan matematika, tetapi saya akan menyarankan satu solusi naif.
Jika interval pembaruan Anda adalah 10 detik, pilih kotak setiap 5 detik, yaitu dua kali lebih sering saat diperbarui. Maka sampel Anda akan menjadi
t0, t5, t10, t15, t20, t25, t30
Sekarang ini akan menjadi data mentah Anda, yang tidak akan Anda gunakan, tetapi Anda lebih suka memulihkan sampel aktual dari itu seperti ini
Alasannya di sini adalah, bahwa kami ingin membocorkan batas untuk mengurangi efek interval pemungutan suara yang tidak akurat pada saklar Anda.
Anda kemudian akan memplot s1, s2, s3 dan Anda akan mendapatkan hasil yang jauh lebih mulus / akurat daripada yang Anda lihat sekarang.
Namun saya yakin ini bukan masalah baru dan saya yakin ada solusi formal bagaimana memulihkan akurasi yang optimal, sayangnya menghasilkan solusi itu di luar keahlian saya. Sesuatu matematika. Pertukaran orang akan lebih siap untuk mengatasi.
sumber
Karena Anda memberikan suara dengan kecepatan yang sama dengan penghitung yang diperbarui, Anda kemungkinan besar tidak sinkron.
Dengan mengkonfigurasi
Anda dapat mengurangi interval penghitung SNMP diperbarui menjadi sekitar 1 detik. Ini akan menghasilkan nilai yang lebih akurat untuk throughput ketika Anda melakukan polling setiap 10 detik.
FYI, ini adalah perintah tersembunyi.
sumber