Masih takut: Adaptor host membatalkan permintaan setelah mengikuti langkah-langkah yang disarankan

9

Saya mendapatkan aacraid yang terkenal: Adaptor Host membatalkan kesalahan permintaan dengan Adaptec RAID Controller baru saya di bawah I / O tinggi. Saya telah membaca beberapa forum, bahkan Adaptec , yang menetapkan nilai / sys / block / sdX / device / timeout ke 45 akan memperbaikinya. Namun saya menjalankan Ubuntu Server 12.04 yang sudah memiliki nilai ini pada 45 secara default. Saya juga mencoba saran berikutnya yaitu memperbarui bios ponsel saya ke yang terbaru, yang saya lakukan.

Saya tidak yakin apakah ada orang lain yang mengalami kesalahan "aacraid: Host abort request" sebelum bahkan setelah mengambil langkah-langkah ini.

Ini yang saya lihat di syslog saya:

kernel: [ 5493.523282] aacraid: Host adapter abort request (4,0,0,0)
Jan  6 20:29:15 server kernel: [ 5493.523309] aacraid: Host adapter abort request (4,0,0,0)
Jan  6 20:29:15 server kernel: [ 5493.523375] aacraid: Host adapter reset request. SCSI hang ?

Inilah uname-a saya

Linux server 3.2.0-29-generic #46-Ubuntu SMP Fri Jul 27 17:03:23 UTC 2012 x86_64 x86_64 x86_64 GNU/Linux

Terima kasih semuanya,

Jim

Jim
sumber

Jawaban:

1

Jika Anda belum menyelesaikan ini, saya baru-baru ini bergulat dengan masalah yang sama yang dengan cepat meningkat ke susunan setiap 5 menit selama beberapa menit karena IO meningkat. Ubuntu secara default menggunakan penjadwal CFQ yang tidak optimal untuk perangkat keras RAID. Ganti penjadwal ke atas dengan:

echo noop > /sys/block/<blockdevice>/queue/scheduler

Secara pribadi saya terjebak dengan kernel lama tetapi saya telah diberitahu juga meng-upgrade ke driver aacraid terbaru harus memperbaiki masalah - meskipun tidak dapat memverifikasi itu. Namun demikian, beralihlah ke noop. Karena sysfs tidak permanen sehingga Anda mungkin ingin mengatur penjadwal /etc/rc.localatau menggunakan elevator=parameter boot.

Saya akan memperhatikan parameter kernel lainnya serta pengaturan pada Ubuntu adalah standar yang masuk akal untuk sebagian besar perangkat keras yang umum, tetapi sebagian besar server waktu memang membutuhkan perhatian khusus terlepas dari distro yang Anda gunakan.

Kev
sumber
1

Jika pengontrol Adaptec RAID Anda memiliki firmware / BIOS sendiri, Anda mungkin perlu memperbarui itu. Kami memiliki masalah selama I / O tinggi dan mendapat "aacraid: Host abort request abort" juga dan melihat rilis firmware yang lebih baru dari yang ada saat ini yang mengatakan "Memperbaiki masalah di mana firmware dapat menggantung selama tekanan I / O tinggi." http://download.adaptec.com/pdfs/readme/relnotes_arc_fw-b18937_asm-18837.pdf .

Catatan rilis di atas mencantumkan model Adaptec berikut: 2045, 2405, 2405Q, 2805, 5085, 5405, 5405Z, 5445, 5445Z, 5805, 5805Q, 5805Z, 5805ZQ, 51245, 51645, 52445).

Kami juga mendapat baris log seperti:

sd 0:0:0:0: timing out command, waited 360s

dan

Result: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT,SUGGEST_OK

Dalam mencari daring untuk melihat orang lain memiliki masalah yang serupa, kami menemukan jajaran kartu lain yang masalah berikut diperbaiki oleh firmware yang mungkin relevan:

Dua di atas berlaku untuk model Adaptec 7805, 7805Q, 78165, 71605E, 71605, 71605Q, 71685, 72405, 8805, 8885, 8885Q, dan 81605ZQ.

sa289
sumber
Saya pikir controller saya akan hang ketika saya menggunakan arcconfutilitas baris perintah untuk menanyakan status array sebagai bagian dari script pemantauan Nagios reguler kami. Seperti yang ditunjukkan oleh catatan firmware, menggunakan arcconfdapat menyebabkan pengontrol hang.
Stefan Lasiewski