Mengapa hard disk Hitachi HDS5C3020 yang tidak dipartisi mulai mengonsumsi daya 50% lebih banyak 15 menit setelah boot?

19

Dalam sistem Debian 6.0.6 ada 74 buah drive Toshiba DT01ABA200 2TB. Drive ini diidentifikasi sebagai drive Hitachi HDS5C3020BLE630 yang menjalankan revisi firmware MZ4OAAB0. 64 Drive yang terpasang melalui kartu ekspander HP SAS ke pengontrol LSI 2008 SAS, 5 drive lainnya terhubung langsung ke mainboard, 4 drive terhubung ke kontroler PCI berbasis Sil dan 1 drive terakhir hanya bertenaga dan tidak memiliki kabel data yang terhubung. Controller LSI dan Sil card BIOS onboard keduanya dinonaktifkan dan modul mpt2sas dan sata_sil dihapus dari Linux debian 2.6.32-5-amd64 # 1 SMP Sun 23 Sep 10:07:46 UTC 2012 x86_64 GNU / Linux kernel. Modul mpt2sas dimuat setelah boot menggunakan perintah modprobe di /etc/rc.local. 74 drive ini tidak dipartisi, tidak diformat dan juga tidak dipasang.

Sistem mengkonsumsi:

  • dengan 0 drive : 70,6 - 70,9 Watt (juga 15 menit setelah boot);
  • dengan 74 drive : 330 - 360 Watt, tepat setelah boot (setara dengan 3,5 - 3,9W per drive dalam keadaan siaga);
  • dengan 74 drive : 420 - 466 Watt, setiap kali dalam waktu 15 menit uptime (setara dengan 4,7 - 5,3W per drive dalam keadaan siaga).

Spesifikasi drive mencantumkan 4.7W sebagai baca / tulis, dan 3.3W sebagai konsumsi daya idle.

Peningkatan konsumsi daya kemungkinan besar terjadi pada saluran 5V, karena setelah sekitar 1 menit, "over current protection" (OCP) dari catu daya (PSU) mematikan daya. PSU yang digunakan adalah model rel tunggal dengan OCP> 122A pada jalur 12V dan> 55A pada jalur 5V.

Regresi:

  • Tidak masalah apakah drive nilai APM-nya diatur ke dinonaktifkan atau 1 (penghematan daya maksimum).
  • Sistem operasi tidak mencatat aktivitas baca / tulis di /proc/diskstats. Nilai-nilai yang ada identik (28 baca, 0 operasi tulis) segera setelah operasi modprobe.
  • Tidak dapat menguji apa yang terjadi ketika boot ke mainboard itu BIOS - untuk mengecualikan intervensi OS - karena mainboard Super Micro X8SI6-F menjalankan firmware 06/27/12 memiliki bug yang salah membaca suhu sensor CPU +74,0 C sebagai " Tinggi "dalam mode BIOS, dan mematikan daya setelah 1 menit.

Apa yang mungkin menyebabkan aktivitas baca / tulis drive pada semua drive pada menit ke-15 setelah boot dan bagaimana mencegahnya terjadi?

Pro Backup
sumber
Hanya ingin tahu ... Sistem jenis apa ini? Sistem cadangan? Semua perangkat lunak RAID?
ewwhite
Saat ini hanya pengujian, ditujukan untuk penyimpanan cadangan tanpa RAID. Redundansi akan dipasok oleh server sekunder dan tersier opsional.
Pro Backup
@ewwhite mengingatkan saya pada pod Backblaze. Seseorang harus menyebutkan nama itu.
Dmitri Chubarov
@ Dmitri Chubarov Seperti pod penyimpanan Backblaze, tetapi tanpa pengganda port SATA, tinggi 5U, tanpa RAID, 74 bukan 45 drive, satu PSU, hanya konsumsi daya 2,0 Watt untuk pendinginan, dan ketika semua drive berputar tanpa daya, perbedaan suhu 6 derajat derajat antara drive paling keren dan paling hangat.
Pro Backup

Jawaban:

20

Terdengar sangat mirip dengan drive yang melakukan scrubbing SMART (pengujian offline otomatis).

smartctl -a /dev/hdx

harus mengkonfirmasi konfigurasi dengan:

Auto Offline Data Collection: Enabled.

Nonaktifkan dengan:

smartctl --offlineauto=off /dev/hdx

Itu bisa menjadi sesuatu yang lain juga ...

Chris S
sumber
smartctl --offlineauto=offmelakukan trik. Setidaknya selama 32 menit tidak ada lagi peningkatan konsumsi daya yang besar yang menyebabkan PSU OCP dimatikan. Sebagai bonus, hdparm -SX sekarang mengatur drive dari "aktif / idle" ke "siaga". Namun drive yang terpasang pada pengontrol sata_sil tidak dapat berupa pengontrol. Memasukkan sementara drive ini ke pengontrol lain adalah solusinya. Pengaturan pengumpulan data luring bertahan dari reboot dan siklus daya.
Pro Backup