HP SmartArray P400: Bagaimana cara memperbaiki drive logis yang gagal?

8

Saya memiliki HP Server dengan pengontrol SmartArray P400 (termasuk Cache 256 MB / Cadangan Baterai) dengan drive logis dengan drive fisik gagal yang diganti yang tidak dibangun kembali.

Ini adalah tampilannya ketika saya mendeteksi kesalahan:

~ # / usr / sbin / hpacucli slot ctrl = 0 tampilkan konfigurasi
Smart Array P400 di Slot 0 (Tertanam) (sn: XXXX)

  array A (SATA, Space Tidak Digunakan: 0 MB)
    logicaldrive 1 (698.6 GB, RAID 1, OK)
      physicaldrive 1I: 1: 1 (port 1I: box 1: bay 1, SATA, 750 GB, OK)
      physicaldrive 1I: 1: 2 (port 1I: box 1: bay 2, SATA, 750 GB, OK)

  array B (SATA, Space Tidak Terpakai: 0 MB)
    logicaldrive 2 (2.7 TB, RAID 5, Gagal)
      physicaldrive 1I: 1: 3 (port 1I: box 1: bay 3, SATA, 750 GB, OK)
      physicaldrive 1I: 1: 4 (port 1I: box 1: bay 4, SATA, 750 GB, OK)
      physicaldrive 2I: 1: 5 (port 2I: box 1: bay 5, SATA, 750 GB, OK)
      physicaldrive 2I: 1: 6 (port 2I: box 1: bay 6, SATA, 750 GB, Gagal)
      physicaldrive 2I: 1: 7 (port 2I: box 1: bay 7, SATA, 750 GB, OK)

  tidak ditugaskan
      physicaldrive 2I: 1: 8 (port 2I: box 1: bay 8, SATA, 750 GB, OK)
~ # 

Saya berpikir bahwa saya telah mengendarai 2I: 1: 8 yang dikonfigurasi sebagai cadangan untuk Array A dan Array B, tetapi tampaknya ini tidak terjadi :-(. Saya melihat masalah karena kesalahan I / O pada host, bahkan jika hanya 1 drive fisik dari RAID5 yang gagal.

Adakah yang tahu mengapa ini bisa terjadi? Drive logis harus masuk ke mode "Degraded" tetapi masih dapat diakses sepenuhnya dari os host !?

Saya pertama kali mencoba menambahkan drive yang belum ditetapkan 2I: 1: 8 sebagai cadangan untuk logicaldrive 2, tetapi ini tidak mungkin:

~ # / usr / sbin / hpacucli slot ctrl = 0 array B tambahkan suku cadang = 2I: 1: 8
    Kesalahan: Operasi ini tidak didukung dengan konfigurasi saat ini.
    Gunakan perintah "show" pada perangkat untuk menampilkan detail tambahan 
    tentang konfigurasi.
~ #  

Menariknya adalah mungkin untuk menambahkan drive yang belum ditetapkan ke array pertama tanpa masalah. Saya pikir mungkin controller meletakkan array ke "gagal" karena cadangan yang hilang dan melindungi array gagal dari modifikasi. Jadi saya mencoba mengaktifkan kembali drive logis (untuk menambahkan cadangan setelah itu):

~ # / usr / sbin / hpacucli slot ctrl = 0 ld 2 modifikasi dapat diaktifkan kembali
    Peringatan: Data apa pun yang sebelumnya ada pada drive logis mungkin tidak 
    valid atau dapat dipulihkan. Terus? (y / n) y

    Kesalahan: Operasi ini tidak didukung dengan konfigurasi saat ini.
    Gunakan perintah "show" pada perangkat untuk menampilkan detail tambahan
    tentang konfigurasi.
~ # 

Tapi seperti yang Anda lihat, mengaktifkan kembali logis drive ini tidak mungkin.

Sekarang saya mengganti drive yang gagal dengan hotswapping dengan drive yang tidak ditetapkan. Statusnya sekarang terlihat seperti ini:

~ # / usr / sbin / hpacucli slot ctrl = 0 tampilkan konfigurasi
Smart Array P400 di Slot 0 (Tertanam) (sn: XXXX)

  array A (SATA, Space Tidak Digunakan: 0 MB)
    logicaldrive 1 (698.6 GB, RAID 1, OK)
      physicaldrive 1I: 1: 1 (port 1I: box 1: bay 1, SATA, 750 GB, OK)
      physicaldrive 1I: 1: 2 (port 1I: box 1: bay 2, SATA, 750 GB, OK)

  array B (SATA, Space Tidak Terpakai: 0 MB)
    logicaldrive 2 (2.7 TB, RAID 5, Gagal)
      physicaldrive 1I: 1: 3 (port 1I: box 1: bay 3, SATA, 750 GB, OK)
      physicaldrive 1I: 1: 4 (port 1I: box 1: bay 4, SATA, 750 GB, OK)
      physicaldrive 2I: 1: 5 (port 2I: box 1: bay 5, SATA, 750 GB, OK)
      physicaldrive 2I: 1: 6 (port 2I: box 1: bay 6, SATA, 750 GB, OK)
      physicaldrive 2I: 1: 7 (port 2I: box 1: bay 7, SATA, 750 GB, OK)
~ # 

Drive logis masih belum dapat diakses. Mengapa tidak dibangun kembali?

Apa yang dapat saya?

FYI, ini adalah konfigurasi controller saya:

~ # / usr / sbin / hpacucli slot ctrl = 0 tampilkan
 Smart Array P400 di Slot 0 (Tertanam)
  Antarmuka Bus: PCI
  Slot: 0
  Nomor Seri: XXXX
  Nomor Seri Cache: XXXX
  Status RAID 6 (ADG): Diaktifkan
  Status Pengontrol: Oke
  Slot Sasis:
  Revisi Perangkat Keras: Rev E
  Versi Firmware: 5.22
  Prioritas Bangun Kembali: Sedang
  Perluas Prioritas: Sedang
  Penundaan Pemindaian Permukaan: 15 detik
  Analisis Permukaan Inkonsistensi Notifikasi: Dinonaktifkan
  Raid1 Write Buffering: Dinonaktifkan
  Batas Waktu Post Prompt: 0 dtk
  Papan Cache Hadir: Benar
  Status Cache: Oke
  Rasio Akselerator: Baca 25% / 75% Tulis
  Drive Write Cache: Dinonaktifkan
  Total Ukuran Tembolok: 256 MB
  Cache Tulis Tanpa Baterai: Dinonaktifkan
  Sumber Daya Cache Backup: Baterai
  Baterai / Jumlah Kapasitor: 1
  Status Baterai / Kapasitor: Oke
  SATA NCQ Didukung: Benar
~ # 

Terima kasih atas bantuan Anda sebelumnya.

TegtmeierDE
sumber

Jawaban:

5

Jawabannya tidak menyenangkan. Ada kemungkinan besar bahwa array Anda dalam keadaan "menunggu untuk membangun kembali", di mana ada disk lain yang gagal dalam rangkaian array RAID5 yang mencegah pemulihan dari penyelesaian. Inilah sebabnya mengapa Anda harus menghindari RAID5 hari ini . Ini tidak membantu bahwa ini adalah drive SATA ... Kemungkinan masalah bahkan lebih tinggi. Coba matikan sistem (membiarkan drive berputar ke bawah) dan hidupkan kembali. Ikuti petunjuk di layar larik BIOS dan pilih F2opsi untuk "mengaktifkan kembali semua drive logis". Ini dapat memulai proses pembangunan kembali.

Kalau tidak, ini adalah pembangunan kembali / pemulihan dengan disk baru.

putih
sumber
0

Anda harus boot ke ACU dan melihat apa yang sebenarnya terjadi. jika seluruh drive logis tidak dapat diakses, Anda dapat mengaktifkannya kembali di sana.

Kly
sumber