Halo penghuni dari Kesalahan Server
Saya memiliki masalah menjengkelkan dengan LAN sekitar 100 komputer, 2 server domain Windows, dan 12 telepon VoIP. Sejak instalasi mereka sekitar setahun yang lalu, setiap minggu atau lebih, kami melihat telepon VoIP me-reset sendiri - kadang-kadang di tengah panggilan. Secara bersamaan sering ada tanda-tanda kehilangan koneksi sementara pada komputer: membeku di explorer saat mengakses saham jaringan, kesalahan dalam perangkat lunak administrasi kami karena kehilangan koneksi ke server database.
Saya telah melakukan beberapa pemantauan Wireshark pada koneksi antara VoIP PBX dan seluruh jaringan. Wireshark mengambil setumpuk paket TCP yang dikirimkan kembali pada saat kami merekam telepon restart. Log Wireshark menunjukkan sekitar 2 cluster pengiriman ulang sehari mulai dari 5 paket hingga ratusan. Yang ada di setiap cluster terutama antara PBX dan beberapa set telepon VoIP, tetapi tidak selalu set yang sama. Seringkali transmisi ulang pada saat yang sama ditujukan ke telepon yang terhubung ke sakelar yang sama, tetapi kadang-kadang transmisi ulang terjadi bersamaan pada ponsel di ujung jaringan yang berlawanan. Biasanya ada beberapa transmisi ulang bertepatan dalam melewati lalu lintas TCP, misalnya antara mesin klien dan server file.
Lonjakan transmisi ulang dan reset telepon tidak berkorelasi dengan baik ketika jaringan dimuat dengan berat. Mereka tampaknya terjadi sedikit lebih banyak pada siang hari, tetapi sebagian besar di malam hari, ketika lalu lintas harus menurun. Mereka terjadi cukup sering larut malam ketika sebagian besar komputer dimatikan dan lalu lintas harus terendah.
Apakah Anda punya ide yang dapat membantu mendiagnosis penyebab masalah seperti ini? Satu hal yang belum saya coba, tetapi seharusnya saya lakukan adalah memperbarui firmware semua sakelar.
sumber
Jawaban:
Transmisi ulang TCP biasanya disebabkan oleh kemacetan jaringan. Cari sejumlah besar paket siaran pada saat masalah terjadi. Jika persentase lalu lintas siaran dalam tangkapan Anda di atas sekitar 3% dari total lalu lintas yang ditangkap, maka Anda pasti mengalami kemacetan. Cari siaran layer fisik (ARP) dan layer jaringan (resolusi nama) di jaringan. Jika Anda menemukan volume lalu lintas siaran yang tinggi, Anda dapat melacaknya ke sumber dari data penangkapan.
sumber
arp
- dan untuk melihat yang siaran saja, menggunakan filtereth.addr==ff:ff:ff:ff:ff:ff
Mengumpulkan statistik lalu lintas untuk sakelar Anda mungkin menunjukkan bahwa Anda memiliki periode di mana Anda menjalankan pada atau mendekati kapasitas. Ini dapat menyebabkan pengulangan ketika respons tidak kembali dalam batas waktu inital (sering 3 detik). Ini meningkatkan kemacetan sejenak sampai mekanisme mitigasi kemacetan dimulai
Cari orang yang menggunakan media streaming karena dapat menyerap bandwidth dengan cepat.
Anda mungkin dapat mengurangi masalah untuk ponsel dengan membentuk lalu lintas. Ini hanya akan memindahkan masalah ke pengguna lain.
sumber
Kedengarannya seperti spanning tree loop atau badai siaran kepada saya, terutama jika transmisi ulang dan masalah dilokalkan ke saklar yang sama (yang berbeda). Ketika itu terjadi, apa status port pada perangkat L2 Anda? Mungkin saklar buruk atau prioritas jembatan akar buruk? Masalah menarik.
sumber
Anda mungkin telah memecahkan ini karena sudah begitu lama tetapi pada dasarnya Anda perlu mengaktifkan "port fast" pada port yang memiliki titik akhir (telepon voip, workstation, server). Telepon dapat mengirim PDU jadi jika orang itu reboot, itu akan menyebabkan konvergensi STP terjadi sehingga menyebabkan tabel FDB memerah dan semua perangkat melalui 4/5 langkah STP menyenangkan. Dengan menempatkan port dengan titik akhir di "port fast", mereka melewatkan waktu tunggu dan langsung ke mode penerusan.
sumber
Semoga ponsel Anda menggunakan subnet dan VLAN yang berbeda dari komputer lain?
sumber
Itu juga bisa menjadi peralatan yang rusak seperti sakelar yang rusak. Apakah pengiriman ulang berkorelasi dengan telepon / komputer pada satu saklar tertentu atau bagian dari jaringan?
Hanya untuk sedikit memperluas jawaban saya. Tidak semua switch dibuat sama, bahkan jika mereka memiliki spesifikasi yang sama. Beberapa mampu mengatasi beban yang jauh lebih tinggi daripada yang lain karena mereka memiliki prosesor yang lebih cepat di dalam. Bisa jadi sakelar Anda tidak cukup bagus.
Saya akan mulai dengan meletakkan beberapa telepon VOIP Anda yang paling menyusahkan ke saklar fisik mereka sendiri dan melihat apakah pengaturan ulang pada mereka berlanjut. Jika itu hilang maka Anda akan segera menyelesaikannya.
sumber