Strategi pemecahan masalah untuk kinerja iSCSI / NFS yang sangat buruk

9

Kami memiliki Synology RS3412RPxs baru yang menawarkan target iSCSI ke tiga kotak Windows 2008 R2 dan NFS ke satu kotak OpenBSD 5.0.

Masuk ke RS3412 dengan ssh dan membaca / menulis file kecil dan 6GB menggunakan dd dan berbagai pemblokiran menunjukkan kinerja I / O disk yang luar biasa.

Menggunakan dd atau iometer pada klien iSCSI / NFS, kami mencapai hingga 20Mbps (Itu bukan kesalahan ketik. Dua puluh Mbps). Kami agak berharap untuk memanfaatkan lebih baik beberapa Nbit Gbit di Synology.

Saya telah memverifikasi sakelar dan konfigurasi port NIC diatur ke gigabit, bukan negosiasi otomatis. Kami sudah mencoba dengan dan tanpa Jumboframes tanpa perbedaan. Saya telah memverifikasi dengan ping bahwa MTU saat ini 9000. Dua pembaruan firmware telah digunakan.

Saya akan mencoba tautan langsung antara target dan inisiator iSCSI untuk mengesampingkan masalah sakelar, tetapi apa pilihan saya yang lain?

Jika saya keluar wireshark / tcpdump, apa yang harus saya cari?

Alex Holst
sumber
Apakah kontrol aliran diaktifkan? Sakelar macam apa di antaranya?
SpacemanSpiff
@SpacemanSpiff: Kontrol aliran tidak diaktifkan. Apakah Anda berharap itu membuat perbedaan? Ini adalah ZyXEL GS2200.
Alex Holst
Agak backplane lemah, tetapi cukup untuk mendapatkan kinerja yang lebih baik dari itu. Penasaran ingin melihat apa kabel crossover membuat Anda bijak kinerja.
SpacemanSpiff

Jawaban:

4

Seperti yang tampaknya menjadi tema umum di sini, lihat lagi pengaturan pengaturan aliran pada sakelar. Jika switch memiliki statistik penghitung Ethernet lihatlah dan lihat apakah ada sejumlah besar frame PAUSE Ethernet. Jika demikian, itu mungkin masalah Anda. Secara umum, menonaktifkan QOS pada sakelar akan menyelesaikan masalah ini.

joeqwerty
sumber
Saya melihat lagi. Kontrol aliran dinonaktifkan dan penghitung PAUSE nol di semua antarmuka. Mengaktifkan kontrol aliran membuat penghitung PAUSE melonjak hingga 25% dari jumlah paket. Kami telah mengidentifikasi beberapa perangkat keras yang tidak menunjukkan kinerja lemah yang sama jadi sekarang kami mencari untuk memperbarui driver nic dan mengganti nics tertentu dengan yang lebih mampu. QoS sudah dinonaktifkan di sakelar. Terima kasih atas masukan Anda.
Alex Holst
Senang membantu ...
joeqwerty
3

Aliran seperti itu memberi tahu saya bahwa berbagai metode kontrol aliran TCP tidak berfungsi dengan benar. Saya telah melihat beberapa masalah dengan kernel Linux berbicara dengan versi Windows post-Vista dan Anda mendapatkan throughput seperti itu. Mereka cenderung muncul cukup baik di Wireshark setelah Anda melihatnya.

Kemungkinan terburuk mutlak adalah bahwa TCP yang tertunda ack benar-benar rusak dan Anda akan melihat pola lalu lintas yang terlihat seperti:

packet
packet
[ack]
packet
packet
[ack]

Saya telah memecahkannya dengan menerapkan pembaruan driver NIC ke server Windows. NIC pintar yang datang dengan beberapa server (broadcom) kadang-kadang bisa gagal dengan cara yang menarik, dan ini adalah salah satunya.

Pola traffic normal akan berupa sejumlah besar paket diikuti oleh paket Ack.

Hal lain yang harus dicari adalah penundaan yang lama. Nilai yang mencurigakan adalah .2 detik dan 1.0 detik. Itu menunjukkan bahwa satu pihak tidak mendapatkan apa yang diharapkan dan menunggu batas waktu berakhir sebelum menjawab. Gabungkan pola paket yang buruk di atas dengan keterlambatan 200 ms untuk ACK dan Anda mendapatkan throughput sebesar 1MB / s.

Itu adalah pola lalu lintas buruk yang mudah diketahui.

Saya belum pernah bekerja dengan perangkat NAS semacam itu, jadi saya tidak tahu bagaimana caranya memperbaiki apa pun yang ditemukan.

sysadmin1138
sumber