Memecahkan masalah jaringan "lambat"

21

Kita semua punya keluhan bahwa "jaringan" itu "lambat" di beberapa titik: mungkin dilokalisasi ke satu ruangan (switch) atau satu komputer, mungkin hanya Internet (DNS? Masalah browser?), Mungkin hanya satu aplikasi (Permintaan SQL yang sudah berjalan lama? Pemindaian AV berjalan?).

Ketika Anda telah mengesampingkan masalah sistem dan / atau aplikasi yang jelas, bagaimana Anda bisa menguji jaringan untuk kelambatan atau perilaku tidak menentu? Apakah Anda meningkatkan lapisan OSI? Jika demikian, bagaimana cara memeriksa setiap lapisan? Apa yang Anda lakukan untuk memastikan jaringan fisik ok di lingkungan yang tidak dikenal? Bagaimana dengan terlalu banyak siaran atau badai siaran? Layer 3 ke atas? traceroute? Adakah tips, metode, ide lain? Fitur dan alat yang harus dimiliki (mirror port, SNMP, pemantauan, dll.) Untuk semua ukuran jaringan?

WuckaChucka
sumber
1
mungkin, tapi saya pikir wiki akan memiliki umur panjang lebih lama dan memberi lebih banyak orang kesempatan untuk berkontribusi.
WuckaChucka
Pertama saya harus yakin bahwa ini adalah "internet"! Lebih sering daripada itu bukan "internet". Sebagian besar pengguna yang pernah saya kunjungi mengatakan internet turun bahkan ketika mereka mencoba mengakses server file lokal ..
tony roth
2
Itu karena semua pengguna Anda streaming umpan video Piala Dunia sekarang!
BillN

Jawaban:

9

tcpdump dan wireshark adalah teman Anda.

Saya menemukan bahwa menonton paket pada kabel dari jaringan 'lambat' vs jaringan 'baik' biasanya yang menunjukkan masalah.

Ada banyak jenis 'lambat'.

Anda dapat melacak latensi ke situs lokal dan internet menggunakan alat seperti SmokePing. (SmokePing dapat dikonfigurasi untuk melacak latensi ICMP serta latensi layanan dari layanan TCP)

Switch Anda harus melacak paket siaran vs paket unicast. Grafik rasio itu.

Saya juga suka memantau traceroute (memeriksa nama domain ISP melompat di antara situs saya sendiri 'penting').

Saya harap komentar ini membantu.

Joel K
sumber
1
Saat menonton paket, beberapa hal apa yang Anda cari atau "tanda tanda" bahwa ada masalah?
WuckaChucka
3
Cari sejumlah besar transmisi ulang TCP dan \ atau pengaturan ulang TCP. juga mencari persentase lalu lintas siaran yang tinggi.
joeqwerty
luar biasa. Saya hampir akan memasukkannya ke dalam jawaban yang terpisah.
WuckaChucka
jika Anda dapat menggunakan netmon 3+ dari MS, pergi ke microsoft research dan unduh tcp analyzer research.microsoft.com/en-us/downloads/... ini cukup keren untuk debugging masalah jaringan. juga ada versi 32bit jika perlu.
tony roth
+1 untuk SmokePing. Itu, bersama dengan hal-hal seperti IPSLA di router dan switch Cisco, dapat membantu Anda memahami jika ada jaringan yang lambat, atau aplikasi yang lambat.
Christopher Cashell
6

Sulit untuk memberikan jawaban spesifik karena 90% dari pekerjaan ini adalah pengalaman yang mengajarkan Anda di mana mencari masalah seperti apa, dan 90% lainnya mengetahui di mana harus mencari di Google untuk mendapatkan petunjuk dari mana harus memulai.

Saya biasanya mencoba barang-barang kantong kertas seperti meminta pelanggan untuk mendemonstrasikan masalah (kebanyakan untuk mengesampingkan masalah jari dan masalah apa pun yang pelanggan mungkin uraikan masalahnya), kemudian mencoba menduplikasi masalahnya di komputer lain. Melakukan hal itu sering memberi Anda wawasan ke mana harus mencari.

Jangan lupa masalah perbaikan reboot, terutama untuk sistem Windows, bahkan hari ini. Dulu seperti ini sehingga saya akan bertanya kepada orang-orang "Apakah Anda reboot? Yah coba itu dan beri tahu saya jika masalahnya masih ada" - ini memperbaiki sebagian besar masalah yang saya tanyakan.

Sering juga ada buah yang menggantung rendah dalam masalah resolusi DNS dan konektivitas dasar (ACL pada router, celah udara di jaringan, ping / traceroutes / mtrs ke situs jarak jauh, dll).

Untuk layanan yang Anda kendalikan secara langsung, menjalankan nagios atau sesuatu untuk memastikan layanan tersebut benar-benar berjalan sering dapat memicu Anda untuk memperbaiki masalah sebelum pelanggan memberi tahu Anda tentang hal itu. Anda mungkin juga ingin menjalankan pengumpulan statistik, baik secara langsung melalui munin atau sesuatu, atau melalui SNMP ke sesuatu seperti Cacti.

Saya biasanya mencoba membuat Cacti bekerja melawan setidaknya semua sakelar inti dan firewall saya; jika memungkinkan, saya menjalankan Cacti terhadap semua yang saya bisa. Dalam kasus ini saya biasanya mencari hal-hal seperti jumlah kesalahan port atau lalu lintas yang berlebihan. Grafik firewall dari beberapa perangkat dapat menunjukkan penggunaan CPU dan sesi bersamaan; Anda akan bisa belajar pada ambang apa perangkat firewall Anda mulai memiliki masalah.

Firewall Anda mungkin dapat masuk ke perangkat syslog; jika demikian, catat semua yang Anda bisa dan lihat petunjuk itu. Ini akan lebih mudah jika Anda menjalankan sesuatu seperti syslog-ng atau rsyslog atau splunk yang memungkinkan Anda membagi log Anda daripada berurusan dengan satu file monolitik.

Saya juga mencoba menjalankan nfsen terhadap setidaknya bagian dalam firewall saya, dan uplink ke penyedia internet jika memungkinkan. Ini memungkinkan Anda kembali ke masa lalu untuk melihat sesi untuk melihat siapa yang melakukan apa; ini terkadang bisa menangkap perilaku yang menarik.

David Mackintosh
sumber
5

Berikut adalah beberapa alat yang berguna untuk mengatasi masalah latensi dan masalah jaringan lainnya:

  • yang OSI modus l - mulai dari bawah dan bekerja dengan cara Anda
  • ping - periksa RTT Anda (yaitu latensi)
  • Ping HTTP - berguna jika firewall Anda memblokir ICMP normal
  • ping -r 9 - berguna untuk mengidentifikasi situasi rute asimetris
  • traceroute - bagaimana paket saya sampai di sana dan bagaimana router di sepanjang jalan merespons? Ketahuilah bahwa router sering memproses paket-paket ini dengan prioritas rendah, sehingga kinerja nyata mungkin lebih baik.
  • Wireshark - membutuhkan keahlian, tetapi Anda tidak bisa mendapatkan tingkat yang lebih rendah
  • SpeedGuide.net TCP / IP Analyzer - periksa pengaturan TCP PC Anda
  • SG TCP Optimizer - (hanya Windows) menyarankan cara untuk mengoptimalkan pengaturan NIC Anda
  • IP Chicken - apa alamat ip sumber Anda (bukan-NAT)?
  • http://downforeveryoneorjustme.com/ - mungkin itu Anda ...
  • Tes kecepatan bandwidth - periksa kecepatan unduh / unggah Anda
  • Alat jaringan - jalankan alat / tes dari luar jaringan Anda
  • periksa port jaringan Anda apakah ada kesalahan / CRC's / etc. -
  • periksa jaringan Anda untuk penggunaan berlebih (monitor bandwidth) & badai penyiaran
  • periksa banjir unicast - gunakan wireshark dan monitor untuk lalu lintas unicast yang tidak diperuntukkan bagi stasiun kerja Anda.
  • verifikasi jembatan akar spanning-tree Anda ditempatkan dengan benar
Peter
sumber
Jika ping -r habis, apa isinya? Sebagai contoh ping 8.8.8.8tidak bekerja, tetapi ping -r 9 8.8.8.8tidak
Michiel van Vaardegem
4

Jika Anda menjalankan jaringan nirkabel, salah satu gangguan lambat yang sering terjadi adalah gangguan saluran. Sekelompok SSID di satu area dapat benar-benar memperlambat lalu lintas jaringan. (Pikirkan: demo iPhone 4 di WWDC '10).

Memecahkan masalah ini cukup mudah jika dengan perangkat lunak yang dapat menunjukkan kepada Anda pola lalu lintas nirkabel di area tersebut. Ada yang gratis dan berbasis web yang bagus di: http://meraki.com/tools/stumbler . (pengungkapan: Saya bekerja untuk Meraki)

Untuk mengurangi gangguan, lebih baik berada di saluran 1, 6, atau 11. Menggunakan gigi 802.11n dengan frekuensi 5GHz juga bisa membantu.

joeybaker
sumber
1

Saya selalu mulai dengan memonitor hal-hal layer 2 menggunakan Cacti . Itu akan memberi Anda sejumlah data yang dapat Anda gunakan untuk mencari pola dan Anda dapat membandingkan grafik Cacti Anda ketika semuanya bekerja dengan baik vs ketika pengguna melihat kelambatan.

Mungkin tidak akan menemukan masalah yang sebenarnya, tetapi itu akan memberi Anda tempat awal yang baik untuk membantu mempersempit masalah.

TonyB
sumber
Adakah yang Anda cari dalam grafik Cacti?
WuckaChucka
1

Saya mulai dari router terluar dan melakukan pekerjaan turun, dan saya mengukur kinerja dengan cara yang paling primitif: menggunakan situs pengujian bandwidth, atau situs FTP eksternal yang dikenal yang akan memberi Anda kecepatan unggah / unduh, dan terus turun hingga Anda temukan level di mana masalahnya berada.

Setelah Anda tahu di mana masalahnya, gunakan alat dan monitor mewah Anda. Tapi jangan buang waktu melakukan hal itu di setiap lapisan. Itu akan berlangsung selamanya.

Satanicpuppy
sumber
Bagaimana dengan kinerja aplikasi internal?
WuckaChucka
@wuckachucka: Biasanya jika ada masalah dengan kode, itu muncul di seluruh log, jadi pemecahan masalah tidak terlalu buruk. Anda juga tahu harus mulai dari mana (aplikasi). Masalah terbesar dengan pemecahan masalah jaringan adalah MENCARI masalah. Jika Anda memiliki ketidakcocokan kecepatan port atau MTU yang buruk atau masalah fisik lainnya, itu adalah bajingan lengkap untuk memecahkan masalah melalui log, dan pendekatan manusia gua memiliki banyak keuntungan di sana.
Satanicpuppy
1

Anda juga perlu mengetahui lingkungan server dan desktop / klien Anda, daripada hanya menganggap pengguna benar ketika mereka mengatakan "jaringan lambat." Anda perlu memecahkan masalah secara metodis setiap masalah - seperti yang orang lain katakan, Anda harus terlebih dahulu dapat melihat dan mereproduksi kesalahan secara ideal, dan kemudian bekerja dari sana dengan cara yang masuk akal untuk skenario.

Akan tetapi, memiliki manajemen dan pemantauan yang baik di jaringan dan server dapat menghemat banyak waktu karena Anda tidak mencoba membuat instrumen dengan cepat sembari mungkin juga mencoba mengurangi atau memperbaiki gejala, dan menangani keluhan pengguna / pelanggan.

Jawaban untuk tcpdump dan wireshark tidak salah, itu bisa menjadi bagian penting dari toolkit Anda. Tetapi kecuali Anda benar-benar yakin bahwa itu sebenarnya jaringan, mereka seharusnya tidak menjadi hal pertama yang Anda raih.

mfinni
sumber
0

Jaringan lambat adalah fenomena umum. Kecepatan jaringan yang lambat dapat disebabkan oleh beberapa hal. memecahkan masalah jaringan lambat adalah salah satu pekerjaan paling umum dan menyusahkan dalam manajemen jaringan harian.

Menurut analisis, alasan utama untuk jaringan lambat adalah:

Loopback
Broadcast/Multicast storm
Virus attack
Server slow response
Too many clients
Application slow response
Error client mask

Bagaimana kita dapat dengan cepat mengetahui penyebab lambatnya jaringan terjadi? Ini adalah ide yang baik untuk menangkap dan menganalisis paket dengan penganalisa jaringan (Ax3soft Unicorn, wireshark, dan sebagainya).

Anda juga membaca artikel "Temukan Alasan untuk Jaringan Lambat", mengklik ke URL ( http://www.ids-sax2.com//Unicorn/Tutorials/Find-Reason-for-Slow-Network-with-Ax3soft-Unicorn .htm ) untuk mengunjunginya.

Andy
sumber