Kami baru-baru ini memiliki sedikit masalah dengan jaringan di mana beberapa server sebentar-sebentar akan kehilangan konektivitas jaringan dengan cara yang cukup menyakitkan untuk diselesaikan (diperlukan reboot keras). Ini telah berlangsung selama sekitar dua minggu, tampaknya secara acak, di server yang berbeda. Tidak ada pola khusus yang bisa kita pahami.
Setelah beberapa menggali ke dalamnya, kami melihat bahwa saklar melaporkan 100 Mbps untuk port masalah:
Ini terdengar sangat seperti apa yang terjadi dalam artikel Joel Spolsky Five Whys
Michael menghabiskan beberapa waktu melakukan post-mortem, dan menemukan bahwa masalahnya adalah masalah konfigurasi sederhana di sakelar. Ada beberapa kemungkinan kecepatan yang dapat digunakan saklar untuk berkomunikasi (10, 100, atau 1000 megabit / detik). Anda dapat mengatur kecepatan secara manual, atau Anda dapat membiarkan sakelar secara otomatis menegosiasikan kecepatan tertinggi yang dapat digunakan oleh kedua belah pihak. Sakelar yang gagal telah diatur ke negosiasi otomatis. Ini biasanya berhasil, tetapi tidak selalu, dan pada pagi hari tanggal 10 Januari, itu tidak berhasil.
Kami sekarang telah menonaktifkan negosiasi otomatis pada perangkat keras jaringan kami dan menetapkannya ke tingkat tetap 1000 Mbps (gigabit).
Pertanyaan saya kepada mereka yang memiliki keahlian jaringan perangkat keras server:
- Seberapa umum masalah negosiasi otomatis dengan perangkat keras jaringan modern?
- Apakah ini dianggap baik, praktik jaringan standar untuk menonaktifkan negosiasi otomatis dan mengatur kecepatan tetap saat mengatur jaringan?
sumber
Jawaban:
Saya belum melihat masalah dengan negosiasi otomatis kecepatan jaringan yang tidak disebabkan oleh (a) ketidakcocokan manual di salah satu ujung tautan dan otomatis di sisi lain atau (b) komponen tautan yang gagal ( kabel, port, dll).
Ini tergantung pada admin, tetapi pengalaman saya menunjukkan kepada saya bahwa jika Anda secara manual menentukan kecepatan tautan dan pengaturan dupleks, maka Anda akan mengalami ketidakcocokan kecepatan. Mengapa? Karena hampir tidak mungkin untuk mendokumentasikan berbagai koneksi antara sakelar dan server dan kemudian ikuti dokumentasi itu ketika membuat perubahan. Sebagian besar kegagalan yang saya lihat adalah karena 1 (a) dan Anda hanya masuk ke situasi itu ketika Anda mulai mengatur pengaturan kecepatan / dupleks secara manual.
Seperti disebutkan dalam dokumentasi Cisco :
Kecuali jika Anda siap untuk menyiapkan sistem manajemen perubahan untuk perubahan jaringan yang memerlukan verifikasi kecepatan / dupleks (dan jangan lupa kontrol aliran) atau bersedia berurusan dengan ketidaksesuaian sesekali yang datang dari menentukan pengaturan ini secara manual pada semua perangkat jaringan, kemudian tetap dengan konfigurasi default otomatis / otomatis.
Di masa mendatang, pertimbangkan untuk memantau kesalahan pada port switch dengan MRTG sehingga Anda dapat menemukan masalah ini sebelum Anda memiliki masalah.
Sunting: Saya melihat banyak orang merujuk kegagalan negosiasi pada peralatan lama. Ya, ini merupakan masalah sejak dulu ketika standar dibuat dan tidak semua perangkat mengikutinya. Apakah NIC dan sakelar Anda berumur kurang dari 10 tahun? Jika demikian, maka ini tidak akan menjadi masalah.
sumber
Sangat umum, saya punya banyak masalah selama bertahun-tahun dengan berbagai jenis perangkat keras.
Menurut pendapat saya jika pengaturannya statis (yaitu rak server) dan Anda tidak berpikir akan ada perubahan, itu adalah ide yang baik untuk mengatur kecepatan dan dupleks secara manual. Asalkan didokumentasikan dengan baik sehingga masalah di masa depan dapat dihindari.
SUNTING:
Hanya untuk memperjelas, saya tidak menganjurkan menggunakan kecepatan manual di seluruh jaringan Anda, saya akan mengatakan bahwa 95% dari waktu otomatis / otomatis adalah cara untuk pergi. Saya hanya mengatakan saya punya masalah dengan duplex / kecepatan dan ada bagian kecil dari jaringan saya (yaitu salah satu rak server kami) yang sebagian besar memiliki pengaturan manual. Kami mengoperasikan LAN yang sangat dikontrol ketat dengan port yang tidak digunakan sedang dimatikan dan MAC-Filter di sebagian besar port sehingga melacak kecepatannya tidak terlalu sulit.
sumber
Saya percaya jika negosiasi otomatis bekerja selama satu jam sehari atau sebulan dan kemudian untuk beberapa alasan "terjadi sesuatu" yang mengatur tautan ke kecepatan tetap "memperbaikinya" ada masalah yang tidak diselesaikan tetapi dielakkan sebagai gantinya. Saya kira saya melihat pengaturan tautan untuk diperbaiki sebagai solusi sementara sampai masalah yang sebenarnya diperbaiki.
sumber
Jadi langkah pemecahan masalah (anggap Anda berhenti setelah masing-masing dan menunggu masalah muncul kembali):
Pada titik ini, Anda telah menghilangkan konfigurasi, port fisik yang Anda tancapkan, kabel di antaranya. Jika masih terjadi, beberapa penyebab lain mungkin:
Latar belakang / mengapa jawaban saya adalah yang paling mengagumkan: Saya bekerja sebagai insinyur jaringan / sistem dalam industri keuangan, dan inilah pengalaman saya dengan jaringan global kecil-kecil kami (15 kantor cabang, 8 pusat data):
Semua port LAN kami adalah autoneg, karena kami mengontrol peralatan di kedua ujungnya, dan memiliki semacam akses ke kedua sisi --- yang mungkin sesederhana mendapatkan telepon ke seseorang dan meminta mereka memeriksa pengaturan. Dalam tiga tahun, saya hanya pernah mengalami salah satu port internal kami gagal karena kegagalan autoneg, dan itu karena kabel yang buruk --- hilang setelah mengganti kabel.
Kami memiliki lebih banyak masalah di mana pendahulu telah melakukan hardcod 100 / penuh pada NIC mereka, dan tidak mendokumentasikan fakta itu. Setel ulang semuanya menjadi otomatis / otomatis pada jendela pemeliharaan berikutnya dan sejak itu tidak ada masalah dengannya.
Di beberapa tempat di mana kami mendapat handoff tembaga dari pembawa untuk WAN kami? Anda seharusnya cukup berharap koneksi WAN / Internet tembaga menyedot, sepanjang waktu --- sebagian karena Anda tidak tahu apa yang ada di sisi lain. Beberapa saklar Ekstrim kuno yang kebetulan memiliki firmware kereta untuk autoneg tetapi apakah pemberian tag MPLS? Konverter media seharga $ 5 karena perangkat Ciena edge Anda yang $ 200k terlalu bagus untuk menyediakan Ethernet daripada twisted pair? Tentukan terlebih dahulu bagaimana hal itu akan ditangani dan berpegang teguh pada itu, kemudian mengharapkan beberapa twit di dalam operator untuk mengubahnya pukul 10 malam pada hari Sabtu karena konfigurasi yang disepakati tidak pernah didokumentasikan dan mereka memiliki beberapa kebijakan untuk diikuti.
Namun, serius, dapatkan handoff serat dari ISP Anda.
sumber
Jaringan yang saya bertanggung jawab untuk (bersama dengan beberapa orang lain) terdiri dari ~ 40 server, 1000+ workstation (tersebar di kampus yang agak besar) dan ~ 1000 WAP juga tersebar di area yang luas dengan beragam jenis dan usia peralatan jaringan.
Seperti yang dikatakan dimitri.p, ketika sesuatu tiba-tiba gagal menghentikan negosiasi otomatis, biasanya itu merupakan indikasi masalah lain. Mengatur port secara manual mirip dengan meletakkan bandaid pada seseorang yang ditusuk di dalam usus - itu mungkin menghentikan pendarahan, tetapi pasti ada kerusakan di bawahnya.
Daftar periksa saya yang biasa:
Kami, sebagai suatu peraturan, tidak pernah menonaktifkan autoneg pada server (atau apa pun di pusat data) kecuali itu adalah situasi di mana semua kemungkinan penyebab lainnya telah dihilangkan, kami memindahkan port switch, mengubah kabel, menguji NIC, dll. Dan tidak ada pilihan lain. Dalam hal ini, itu akan didokumentasikan sampai mati. Ini sangat jarang terjadi, dan biasanya dengan peralatan yang kita tidak dapat mengakses untuk memeriksa pengaturan BIOS dan OS.
Sebaliknya, workstation dan AP adalah cerita yang berbeda. Gagal autoneg adalah tanda klasik dari kabel jelek, dan sering kali kita harus secara manual mengatur kecepatan dan dupleks sampai musim panas berjalan-kabel-baru-di-tembok-musim datang.
sumber
Ini adalah mitos jaringan. Orang-orang jaringan kami bersumpah dengan omong kosong ini, karena pada tahun 1998 Bay switch tidak akan bernegosiasi dengan Cisco atau sesuatu. Jadi, alih-alih menggunakan default untuk 99,999% dari peralatan di bumi, kami melakukan latihan manajemen konfigurasi yang konyol ini dan kambing hitam untuk saat-saat ketika pembaruan driver NIC me-reset pengaturan untuk bernegosiasi otomatis dan apa pun yang terjadi.
Itu membuat lebih lucu karena banyak server kami menggunakan fitur yang meragukan seperti NIC teaming, yang mencegah Anda kehilangan akses jaringan jika terjadi kegagalan switch, sementara membuat Anda terkena kemungkinan kegagalan perangkat lunak yang jauh lebih besar. (Driver selalu payah)
Dalam membela orang-orang jaringan, banyak severs berjalan dengan driver NIC Windows-default, yang biasanya payah. Jika Anda memiliki masalah dengan negosiasi otomatis, dan peralatan Anda tidak sesuai dengan pemerintahan Clinton, perbarui driver NIC tersebut.
sumber
Anda harus bernegosiasi otomatis. Jika Anda memiliki sakelar yang tidak akan dinegosiasikan secara andal, beli sakelar yang lebih baik.
Gigabit seharusnya dinegosiasikan secara otomatis, dan itu termasuk deteksi auto-crossover (MDI-X).
100baseT dijamin gagal jika salah satu ujungnya diatur ke otomatis dan yang lainnya diatur ke manual, dan itu sesuai spesifikasi. Jika Anda memaksa salah satu ujung ke 100 / penuh maka ujung lainnya akan dinegosiasikan secara otomatis ke 100 / setengah, memberikan Anda ketidakcocokan duplex.
sumber
Biasanya saya mengatur server untuk diperbaiki karena saya telah melihat peralatan jaringan bernegosiasi ke 10 / setengah bukannya 1000 / penuh.
Juga beberapa CoLos mengatur sakelar mereka untuk tidak bernegosiasi, tetapi hanya membuat tautan pada 1000 / penuh.
sumber
Menonaktifkan negosiasi otomatis dalam konfigurasi awal yang belum diuji mirip dengan pemrograman voodoo - Anda mengubah sesuatu tanpa alasan yang kuat. Jika, setelah diuji, Anda melihat ada ketidakcocokan dupleks atau kecepatan atau ada kesalahan berlebihan pada port, kemudian terlibat dalam pemecahan masalah lainnya dan akhirnya memperbaiki konfigurasi jika perlu.
Ketika Anda meningkatkan driver atau mengganti perangkat keras, tidak ada jaminan bahwa pengaturan Anda akan dipertahankan di sisi server.
Atur kedua sisi tautan untuk bernegosiasi, atau perbaiki kedua sisi. Ketika Anda memperbaiki pengaturan kecepatan dan dupleks pada beberapa perangkat, mereka tidak lagi mengumumkan kemampuan mereka kepada rekan-rekan mereka. Saya tidak tahu apa yang dikatakan standar Ethernet tentang apa yang harus dilakukan ketika satu sisi mengumumkan kemampuan dan sisi lainnya tidak, dan itu mungkin berarti banyak pelaksana yang juga tidak tahu. Beberapa akan memilih penyebut umum terendah, yaitu 10-setengah dan yang lain akan menganggap semuanya baik-baik saja dan memilih kecepatan tercepat yang mungkin.
Ada beberapa perangkat keras kontemporer yang tidak mendukung negosiasi otomatis pada Ethernet tembaga gigabit, seperti (setidaknya beberapa) switch Cisco dengan SFP tembaga.
sumber
Bertahun-tahun yang lalu saya menghabiskan beberapa waktu bekerja untuk 3com melakukan dukungan teknis untuk hampir semua peralatan jaringan mereka. Sungguh menakjubkan betapa sering masalah ini muncul dan cukup banyak prosedur standar untuk mengatur semuanya secara manual.
sumber
Saya punya banyak masalah dengan negosiasi otomatis. Banyak, tentu saja, berarti satu setiap beberapa bulan, tetapi itu satu masalah terlalu banyak dalam buku saya.
Masalah negosiasi otomatis sulit ditemukan, terutama ketika orang yang menangani jaringan, server, aplikasi, dan basis data adalah empat tim yang berbeda. Biasanya, dua yang terakhir akan menghabiskan banyak waktu untuk bolak-balik, menuduh satu sama lain kinerja buruk dan berbohong tentang pengukuran, dan kadang-kadang menendang ke orang-orang server, yang sepatutnya akan melihat output "atas" dan mengatakan semuanya baik-baik saja dengan server.
Ini berlanjut sampai masalah meningkat ke titik di mana "ahli" (sebenarnya, seseorang yang generalis, dan dengan demikian memahami jaringan, perangkat keras, sistem operasi, database, kerangka kerja dan aplikasi) ditugaskan untuk masalah, dan menemukan masalah dalam lima atau sepuluh menit.
Jadi, aturan praktis saya sendiri, setiap kali saya memiliki kemampuan untuk melakukan sesuatu tentang hal itu, adalah SELALU menetapkan kecepatan tetap pada server produksi, switcher dan router. Server non-produksi juga, jika mereka cukup terpisah untuk orang-orang yang menggunakannya tidak memiliki akses root di dalamnya.
Switch yang menangani akses desktop / notebook dapat dibiarkan melakukan negosiasi otomatis, dan ada pengecualian untuk aturan tersebut. Untuk menyebutkan satu saja, jika ada banyak perubahan yang terjadi di jaringan, lebih baik membiarkannya di auto dan mengawasi hal-hal.
Poin lain yang mungkin berguna, pilihan apa pun yang Anda buat mengenai negosiasi otomatis , adalah memantau masalahnya. Cukup konfigurasikan Nagios atau apa pun yang Anda miliki untuk mengawasi keadaan port penting. Anda sudah memantau peralatan jaringan itu, bukan?
sumber
Yang kasar. Saya telah melihat 100MB NIC 3com yang tidak akan terhubung pada apa pun di atas 10MB jika Anda memaksa kecepatan atau duplex. Anda hanya bisa mendapatkan kecepatan penuh dengan membiarkan mereka bernegosiasi meskipun pengemudi memiliki pengaturan 100Mb Penuh dan Setengah 100Mb.
Banyak driver NIC tidak akan membiarkan Anda menentukan 1000Mb. Satu-satunya pilihan adalah 10, 100, Otomatis. Sekali lagi memaksa Anda untuk melakukan Otomatis jika Anda ingin kecepatan penuh. misalnya driver Broadcom netXtreme 57xx Gigabit berperilaku seperti ini.
Anda dapat dengan mudah memaksa Gigabit pada saklar tetapi saya pikir Anda akan dipaksa untuk membiarkan sebagian besar NIC otomatis dinegosiasikan.
sumber
Dalam pengalaman saya (kebanyakan peralatan 3Com dan HP, tidak banyak Cisco), negosiasi otomatis tidak menyebabkan banyak masalah.
Demikian pula untuk mrdenny, saya biasanya akan mengatur server ke kecepatan tercepat mereka (kami masih punya beberapa di 100), dupleks penuh, dan kemudian meninggalkan saklar di otomatis. Karena kami memiliki campuran kecepatan pada kedua server dan workstation, saya lebih suka membiarkan sakelar pada otomatis dan membiarkannya beradaptasi dengan titik akhir.
sumber
Saya punya beberapa masalah dengan negosiasi otomatis dalam pengaturan rumah dan masalahnya adalah kabel, khususnya kabel jaringan digulung dalam satu lingkaran dengan diameter terlalu kecil atau meletakkannya terlalu dekat dengan kabel listrik.
Tapi saya pikir saran itu agak terlalu sepele untuk pengaturan Anda. ;)
sumber
Saya baru-baru ini membaca tentang ini di Network Warrior oleh Gary Donahue. Berdasarkan buku ini untuk negosiasi-otomatis berfungsi dengan baik KEDUA saklar dan NIC harus diatur ke negosiasi-otomatis. Mengatur NIC ke mode kecepatan dan dupleks tertentu dan meninggalkan server pada negosiasi otomatis tidak akan berfungsi dengan baik - negosiasi otomatis adalah protokol dan kedua belah pihak perlu berbicara untuk pengaturan agar berfungsi dengan benar.
Jika Anda ingin mengatur mode kecepatan dan dupleks secara eksplisit, Anda harus melakukannya di kedua ujung koneksi.
sumber
Cisco membahas beberapa kasus di mana Anda mungkin ingin mengkonfigurasi kecepatan port dan duplex secara manual daripada menggunakan negosiasi otomatis, ketika menggunakan perangkat keamanan PIX / ASA: http://www.cisco.com/en/US/products/hw/vpndevc/ps2030/ products_tech_note09186a008009491c.shtml # troubleshooting
sumber
Aturan praktis saya adalah menggunakan negosiasi otomatis untuk semuanya kecuali tautan router kecuali Anda secara khusus memiliki masalah (seperti kartu Broadcom baru-baru ini ... BAH!)
Jika Anda memiliki dua router yang terhubung melalui ethernet misalnya, atur kecepatan secara manual di kedua ujungnya.
sumber