Cara menentukan disk mana yang gagal dalam pengaturan FreeNAS / ZFS

12

Saya sedang membangun server berbasis FreeNAS di dalam supermicro X6DHE-XB 3U enclosure dengan 4G RAM, 16 hot-swap bay SATA. Muncul dengan port 2x8 3Ware kartu RAID, tapi saya berencana hanya menggunakan kemampuan ZFS bukan perangkat keras RAID. Set drive awal saya adalah 8x2TB HITACHI Deskstar 7K3000 HDS723020BLA642 drive.

Jika saya menggunakan RAID berbasis perangkat keras, itu akan memberi saya lampu merah di ruang drive di mana drive gagal. Bagaimana cara kerjanya dengan ZFS ketika drive gagal? Saya tidak berpikir ada jaminan bahwa sda = bay1, sdb = bay2, dll, jadi bagaimana Anda menentukan drive mana yang perlu diganti? Dapatkah ZFS melaporkan kembali ke pengontrol SATA untuk menyalakan lampu "gagal drive"? Apakah itu hanya melaporkan nomor seri drive? Bagaimana jika drive gagal sangat keras sehingga tidak dapat melaporkan nomor seri itu? Saya kira itu adalah ide yang baik untuk menuliskan nomor seri setiap drive dan bay mana yang masuk sebelum Anda ditayangkan. Apakah ada tugas "pra-produksi" lainnya untuk membuat penggantian drive lebih mudah di masa mendatang?

John P.
sumber

Jawaban:

4

zpool status -v akan memberi tahu Anda disk mana yang sedang online atau tidak.

Marcin
sumber
3
+1 FreeNAS berbasis FreeBSD, dan drive akan sesuai dengan urutan yang disediakan kartu. Jika ada pengontrol SAS 8 port tunggal, drive akan menjadi / dev / da0 sampai / dev / da7, dengan penomoran yang sama dengan kartu (kabel yang baik juga diberi label per drive). Jika Anda memiliki banyak pengontrol, atau sesuatu yang rumit, Anda dapat menjalankannya camcontrol devlistuntuk mendapatkan daftar semua drive SAS / SCSI dan kartu, target, dan lun yang digunakan.
Chris S
1
Chris S salah. Drive tidak selalu muncul sesuai urutan yang disediakan kartu. Sebagai contoh, "da7" kami muncul kedua dalam daftar 8 drive ... Juga, status zpool hanya memberikan label dan bukan disk sebenarnya.
Brian Knoblauch
8

Versi FreeNAS saat ini (ver 9.3 saat ini) akan membuat gptid untuk setiap drive yang ditambahkan ke zpool. Segera setelah pembuatan, "status zpool" akan terlihat seperti ini (tergantung pada konfigurasi kolam Anda) ...

#
kumpulan status zpool: status myzfstest
:
pemindaian ONLINE : tidak ada
konfigurasi yang diminta:

    NAME                                            STATE     READ WRITE CKSUM
    myzfstest                                       ONLINE       0     0     0
      raidz-0                                       ONLINE       0     0     0
        gptid/4fc2b789-7b7f-11e4-9585-de9b81338d40  ONLINE       0     0     0
        gptid/51d38480-7b7f-11e4-9585-de9b81338d40  ONLINE       0     0     0
        gptid/54c672cc-7b7f-11e4-9585-de9b81338d40  ONLINE       0     0     0
        gptid/56a07638-7b7f-11e4-9585-de9b81338d40  ONLINE       0     0     0
      raidz2-1                                      ONLINE       0     0     0
        gptid/630e1317-7b7f-11e4-9585-de9b81338d40  ONLINE       0     0     0
        gptid/6557b52d-7b7f-11e4-9585-de9b81338d40  ONLINE       0     0     0
        gptid/667a1318-7b7f-11e4-9585-de9b81338d40  ONLINE       0     0     0
        gptid/68cadf75-7b7f-11e4-9585-de9b81338d40  ONLINE       0     0     0
    logs
      mirror-2                                      ONLINE       0     0     0
        gptid/8839f22e-7b7f-11e4-9585-de9b81338d40  ONLINE       0     0     0
        gptid/8a6d0b14-7b7f-11e4-9585-de9b81338d40  ONLINE       0     0     0
    cache
      gptid/8c2f3824-7b7f-11e4-9585-de9b81338d40    ONLINE       0     0     0
      gptid/8da9ba80-7b7f-11e4-9585-de9b81338d40    ONLINE       0     0     0
    spares
      gptid/72f039f2-7b8a-11e4-9585-de9b81338d40    AVAIL
      gptid/750df91d-7b8a-11e4-9585-de9b81338d40    AVAIL

kesalahan: Tidak ada kesalahan data yang diketahui

Sayangnya, GUI web tidak menunjukkan angka-angka ini kepada Anda. Jadi, jika Anda mendapatkan pesan kesalahan yang mengatakan bahwa "gptid / 6557b52d-7b7f-11e4-9585-de9b81338d40" buruk ... bagaimana Anda tahu drive mana yang harus ditarik? Mengetahui bagian itu membutuhkan kerja keras pada saat instalasi.

  1. Ketika Anda membangun sistem Anda. Tuliskan nomor seri setiap drive dan tulis juga lokasi di mana drive itu dimasukkan. Pada kasing JBOD sisi ganda misalnya, Anda mungkin ingin mencatat depan / belakang, baris, & kolom.
  2. Ketika Anda mem-boot FreeNAS, di GUI web, buka "storage> volume / view disks". Pada tab itu Anda harus memiliki daftar semua drive Anda dan nomor seri mereka. Catat nama drive yang diberikan untuk setiap nomor seri yang Anda miliki di daftar sebelumnya. Jika Anda tidak melihat nomor seri, Anda harus membuka shell dan mengetik smartctl -a /dev/ada0 | grep ^Serial(mengganti "/ dev / ada0" dengan masing-masing nama drive dari daftar)
  3. Sekarang, di shell, kita perlu mencocokkan nama drive dengan semua nomor gptid. Jadi, ketik glabel statusdan Anda harus mendapatkan sesuatu seperti ini ...

    # glabel status
    
    CORRECT>glabel status (y|n|e|a)? yes    
                                          Name  Status  Components  
                                 ufs/FreeNASs3     N/A  ada0s3  
                                 ufs/FreeNASs4     N/A  ada0s4  
                                ufs/FreeNASs1a     N/A  ada0s1a
    gptid/616cddb6-7b7f-11e4-9585-de9b81338d40     N/A  ada0p2  
    gptid/630e1317-7b7f-11e4-9585-de9b81338d40     N/A  da1p1   
    gptid/6557b52d-7b7f-11e4-9585-de9b81338d40     N/A  da2p1   
    gptid/667a1318-7b7f-11e4-9585-de9b81338d40     N/A  da3p1   
    gptid/68cadf75-7b7f-11e4-9585-de9b81338d40     N/A  da4p1   
    
  4. Sekarang tulis semua nomor gptid untuk menghubungkannya dengan nama drive dan dengan demikian nomor seri dan lokasinya. Catatan : ketika Anda melihat sesuatu seperti "da3p1" itu adalah partisi salah satu drive yang diidentifikasi sebagai da3. Daftar di GUI web hanya akan menampilkan label "da3" untuk disk.

Sekarang, ketika sebuah kesalahan muncul mengatakan sebuah disk dengan nomor gptid xyz memiliki kesalahan, Anda akan dapat mereferensikan sheet Anda dan tahu drive mana yang perlu Anda tarik / ganti.

Saya tahu ini sangat terlambat untuk poster aslinya; tetapi, mungkin orang lain akan menganggap ini berguna.

Craig
sumber
1
Untuk pertanyaan awal, "status glabel" adalah bagian penting. Itu akan memungkinkan Anda untuk mengetahui pemetaan antara ID aneh dan fisik.
Brian Knoblauch
Wow. Jawaban yang bagus, tapi agak mengecewakan ZFS tidak memiliki cara yang layak untuk melacak disk.
mikato
5

Yang Anda butuhkan adalah utilitas sas2ircu dari LSI (sekarang Avago). LSI memelihara versi untuk FreeBSD, Linux dan Windwos. Dengan FreeNAS Anda akan memerlukan versi FreeBSD.

Untuk mencobanya, Anda akan meletakkannya di direktori / tmp dan membuatnya dapat dieksekusi terlebih dahulu.

Langkah pertama adalah menemukan ID SAS HBA Anda (contoh):

/tmp# ./sas2ircu list
LSI Corporation SAS2 IR Configuration Utility.
Version 19.00.00.00 (2014.03.17)
Copyright (c) 2008-2014 LSI Corporation. All rights reserved.


         Adapter      Vendor  Device                       SubSys  SubSys
 Index    Type          ID      ID    Pci Address          Ven ID  Dev ID
 -----  ------------  ------  ------  -----------------    ------  ------
   0     SAS2008     1000h    72h   00h:04h:00h:00h      1000h   3020h
SAS2IRCU: Utility Completed Successfully.

Langkah dua akan menghasilkan daftar semua perangkat yang dapat Anda periksa nanti:

/tmp# ./sas2ircu 0 display > disklist.txt

Langkah 3 memeriksa daftar disk Anda. Ini akan terlihat mirip dengan:

/tmp# vi disklist.txt
LSI Corporation SAS2 IR Configuration Utility.
Version 19.00.00.00 (2014.03.17)
Copyright (c) 2008-2014 LSI Corporation. All rights reserved.

Read configuration has been initiated for controller 0
------------------------------------------------------------------------
Controller information
------------------------------------------------------------------------
  Controller type                         : SAS2008
  BIOS version                            : 7.37.00.00
  Firmware version                        : 19.00.00.00
  Channel description                     : 1 Serial Attached SCSI
  Initiator ID                            : 0
  Maximum physical devices                : 255
  Concurrent commands supported           : 3432
  Slot                                    : 4
  Segment                                 : 0
  Bus                                     : 4
  Device                                  : 0
  Function                                : 0
  RAID Support                            : No
------------------------------------------------------------------------
IR Volume information
------------------------------------------------------------------------
------------------------------------------------------------------------
Physical device information
------------------------------------------------------------------------
Initiator at ID #0

Device is a Enclosure services device
  Enclosure #                             : 2
  Slot #                                  : 24
  SAS Address                             : 5003048-0-00d3-a87d
  State                                   : Standby (SBY)
  Manufacturer                            : LSI CORP
  Model Number                            : SAS2X36
  Firmware Revision                       : 0717
  Serial No                               : x36557230
  GUID                                    : N/A
  Drive Type                              : Undetermined

Device is a Enclosure services device
  Enclosure #                             : 3
  Slot #                                  : 0
  SAS Address                             : 5003048-0-00ca-7bfd
  State                                   : Standby (SBY)
  Manufacturer                            : LSI CORP
  Model Number                            : SAS2X28
  Firmware Revision                       : 0717
  Serial No                               : x36557230
  GUID                                    : N/A
  Drive Type                              : Undetermined

Device is a Hard disk
  Enclosure #                             : 4
  Slot #                                  : 0
  SAS Address                             : 5003048-0-00d3-a8cc
  State                                   : Ready (RDY)
  Size (in MB)/(in sectors)               : 1907729/3907029167
  Manufacturer                            : ATA
  Model Number                            : WDC WD20EARS-00M
  Firmware Revision                       : AB51
  Serial No                               : WDWCAZA1037887
  GUID                                    : N/A
  Drive Type                              : Undetermined

Device is a Hard disk
  Enclosure #                             : 4
  Slot #                                  : 1

Langkah 4 adalah mengidentifikasi drive Anda yang gagal - Anda akan mengetahui informasi hilang atau rusak yang dilaporkan pada drive tersebut. Dapatkan Enclosure # dan The Slot # dan gunakan mereka untuk mengedipkan LED baki di langkah 5: Untuk menemukan Enclosure # 4, Slot # 0

 /tmp# ./sas2ircu 0 locate 4:1 ON

Untuk mematikan LED setelah mengganti:

/tmp# ./sas2ircu 0 locate 4:1 OFF

Saya harap ini membantu!

Dimitar Boyn
sumber
beberapa sistem freeNAS mungkin perlu sas3ircu
Brian Minton
2

Lihatlah Volume.

Pilih Volume yang Degradasi.

Di bagian bawah layar Anda ada tiga pilihan ... klik Volume Status

Anda sekarang akan melihat closeup volume dan masing-masing hard drive terdaftar seperti ada3p2, ada5p2, ada6p2, ada4p2 dll.

Pilih Degraded Drive.

Di bagian bawah layar Anda, Anda akan melihat dua opsi; Edit Disk dan Ganti

Pilih Edit Disk

Anda sekarang harus melihat nomor seri dari disk terdegradasi.

Matikan server FreeNAS Anda dan cari disk itu.

wri7913
sumber
Ini harus menjadi jawaban yang benar, Ketika saya melakukan ini, saya menemukan daftar lengkap dari semua serial terlampir, oleh karena itu yang tidak terlampir pasti yang salah! Terima kasih banyak @ wri7913
Delta_zulu
1

Ini mengasumsikan Anda memiliki kasing yang memiliki lampu HD tersendiri (alias kasing server)

Temukan daftar untuk drive yang buruk. Contoh / dev / da9, /dev/sda...etc

Offline disk itu menggunakan perintah terminal GUI atau FreeNAS.

Jalankan DD untuk membaca disk itu ke / dev / null saat Anda melihat bagian depan server untuk cahaya yang sekarang berkedip dengan gila.

sudo dd if=/dev/da# of=/dev/null

Catat lokasi disk, batalkan perintah DD (ctrl-c), dan lanjutkan tentang metode penggantian Anda. Untuk freeNAS, muat disk baru ke atas lalu klik tombol Ganti GUI dan selesaikan proses itu. Setelah selesai, lepaskan drive buruk dan lakukan apa pun yang Anda inginkan dengannya. Uji lebih lanjut, Hapus Aman, hancurkan secara fisik, kirim untuk perbaikan garansi ..... dll.

Easyanswer
sumber
0

cara termudah yang saya temukan.

klik penyimpanan klik lihat drive.

cabut satu kabel sata. cetak label dengan drive yang hilang dari tampilan disk alias ada1 stick label ke sisi drive.

sambungkan kembali drive. cabut kabel sata kedua dari label cetak ada2 dll

maka ketika drive gagal Anda tahu ada2 nya

Michael Harker
sumber