Bagaimana cara memantau status hard disk di belakang Dell PERC H710 Raid Controller dengan CentOS 6?

26

Saya memiliki server Dell yang berjalan CentOS 6menggunakan PERC H710kartu Raid Controller dengan pengaturan Raid 5 dan saya ingin memantau kegagalan hard disk / status kerja di belakang Raid Controller.

Maka saya harus dapat menggunakan skrip bash untuk memantau status hard disk dan mengirim email peringatan jika ada masalah.

Alat LSI MegaRAID SASperintah (Tentang LSI MegaRAID SAS Linux Tools) untuk CentOS / Red Hat / Linux TIDAK mendukung PERC H710 dan smartctljuga TIDAK mendukungnya.

Berdasarkan situs web Dell, CentOSIS tidak didukung untuk server ini ( NX3200 PowerVault) dan saya tidak dapat mengunduh program linux apa pun untuk memantau hard disk.

[root@server ~]# lspci | grep RAID
03:00.0 RAID bus controller: LSI Logic / Symbios Logic MegaRAID SAS 2208 [Thunderbolt] (rev 05)


[root@server ~]# smartctl -a /dev/sda
smartctl 5.43 2012-06-30 r3573 [x86_64-linux-2.6.32-431.el6.x86_64] (local build)
Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net

Vendor:               DELL
Product:              PERC H710
Revision:             3.13
User Capacity:        299,439,751,168 bytes [299 GB]
Logical block size:   512 bytes
Logical Unit id:      ....
Serial number:        ....
Device type:          disk
Local Time is:        Tue Apr 15 16:38:30 2014 SGT
Device does not support SMART

Error Counter logging not supported
Device does not support Self Test logging

Adakah yang tahu cara memonitor status hard disk di balik serangan perangkat keras pada Dell PERC H710 dengan CentOS 6?

Xianlin
sumber

Jawaban:

26

SMART adalah tidak kata terakhir dalam disk atau penyimpanan pemantauan !! Ini adalah komponen, tetapi pengontrol RAID modern menggunakannya bersama dengan metode lain untuk menentukan kesehatan drive dan array.

Saya berasumsi ini adalah pengontrol PERC di server Dell PowerEdge.

Pendekatan Linux-friendly yang biasa untuk pemantauan kesehatan perangkat keras Dell adalah dengan menginstal agen OMSA Dell untuk Linux melalui Yum - http://linux.dell.com/wiki/index.php/Repository/OMSA#Yum_setup

yum install srvadmin-allakan menginstal agen lengkap. Setelah diinstal, Anda dapat menggunakan omreportperintah untuk mendapatkan informasi tentang array Anda.

Contoh:

$ omreport storage vdisk

$ omreport storage pdisk controller=0

$ omreport storage vdisk controller=0 vdisk=1
putih
sumber
7
ini akan menginstal komponen tambahan seperti server web / ssl di mesin Linux saya tetapi tampaknya saya tidak punya pilihan lain! Saya benci menambahkan paket yang tidak perlu ke server saya.
Xianlin
2
Waspadai potensi kebocoran memori dari salah satu program OMSA tersebut. Itu terjadi pada saya perlahan selama 3-4 minggu kemudian booming, tidak ada memori sama sekali untuk linux.
bksunday
1
Ya, kebocorannya ada di dsm_sa_snmpd (jadi saya jalankan 'killall -9 dsm_sa_snmpd', diselesaikan).
MarkusN
5
Pengontrol PERC 7xx dan 8xx hanyalah pengontrol Lara Megaraid dan alat LSI MegaCLI akan berfungsi dengan baik jika Anda tidak ingin mencemari sistem Anda dengan pustaka dell dan layanan apa pun lainnya dan / atau modul kernel yang dijatuhkan hari ini. Ada banyak lembar contekan MegaCLI, skrip pemantauan nagios, dan tips penyesuaian kinerja di luar sana untuk biner LSI. Itu hanya preferensi dan pendapat pribadi saya saja. Saya seorang minimalis.
Aaron
@Xianlin, ini tidak sepenuhnya benar. Ya, itu akan menginstal banyak sampah tetapi lihat jawaban saya. Saya tidak ingin menambahkan paket yang tidak perlu jadi saya mencari tahu hanya yang saya butuhkan untuk penyimpanan.
Mike S
25

Anda dapat melihat status SMART disk dengan perintah smartctl dan -dargumennya. Misalnya, untuk melihat disk pertama dalam array:

# smartctl -a /dev/sda -d sat+megaraid,00
smartctl 5.43 2012-06-30 r3573 [x86_64-linux-2.6.32-358.6.2.el6.x86_64] (local build)
Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF INFORMATION SECTION ===
Device Model:     ST91000640NS
Serial Number:    ........
LU WWN Device Id: . ...... .........
Firmware Version: AA08
User Capacity:    1,000,204,886,016 bytes [1.00 TB]
Sector Size:      512 bytes logical/physical
Device is:        Not in smartctl database [for details use: -P     showall]
ATA Version is:   8
ATA Standard is:  ATA-8-ACS revision 4
Local Time is:    Thu Jul 10 11:21:52 2014 WEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
Warning: This result is based on an Attribute check.
...
...
#

Ini ada di Scientific Linux 6 (OS berbasis RHEL6 lain) dengan smartmontools-5.43-1.el6.x86_64.

Jonathan Barber
sumber
-d megaraid,0sudah cukup di smartctl 6.6pada baris perintah. Dalam DEVICESCANstring di /etc/smartd.confdalamnya dibutuhkan-d removable
Stuart Cardall
9

Jawaban yang diterima merekomendasikan keberanian itu yum install srvadmin-all. Blecch. Inilah cara membuatnya sedikit lebih sedikit blecch-y (tapi tetap blecch-y; Anda bisa menjadi lebih ramping di platform HP. Tapi saya ngelantur ...) Maksud saya, hanya instal komponen-komponen yang diperlukan untuk mengelola penyimpanan pada mesin Anda. .

BTW, jawaban langsung untuk pertanyaan pengguna terletak pada item "Tampilkan disk fisik pada vdisk 0" dalam daftar di bawah ini.

wget -q -O - http://linux.dell.com/repo/hardware/latest/bootstrap.cgi > bootstrap.cgi
bash bootstrap.cgi
yum install srvadmin-base
yum install srvadmin-storageservices

Tambahkan ke root .bashrc:

export PATH=$PATH:/opt/dell/srvadmin/bin

Nikmati:

Perintah RAID

  • Tampilkan semua disk fisik pada pengontrol 0

    $ omreport storage pdisk controller=0
    
  • Tampilkan semua disk logis pada pengontrol 0

    $ omreport storage vdisk controller=0
    
  • Tampilkan semua disk fisik di vdisk 0

    $ omreport storage pdisk controller=0 vdisk=0
    
  • Mengkonfigurasi ulang vdisk menjadi raid1 dari raid0 ( COOL !!!! )

    $ sudo omconfig storage vdisk action=reconfigure controller=0 vdisk=1 raid=r1 pdisk=0:0:2,0:0:3
    
  • Buat vdisk di disk baru:

    $ sudo omconfig storage controller controller=0 action=clearforeignconfig
    $ sudo omconfig storage controller controller=0 action=createvdisk raid=r0 size=max pdisk=0:0:2
    

Info lebih lanjut

BTW, karena ini tidak lebih dari kartu LSI MegaCLI bermerek Dell, Anda mungkin menemukan jawaban Han Solo lebih baik! Namun saya belum mencobanya.

Manisnya

Berikut adalah contoh dari output omreport, disalurkan melalui grep untuk kumpulan data yang lezat:

$ omreport storage pdisk controller=0 vdisk=0 | grep -v ": Not "
List of Physical Disks belonging to root

Controller PERC H700 Integrated (Embedded)
ID                              : 0:0:0
Status                          : Ok
Name                            : Physical Disk 0:0:0
State                           : Online
Power Status                    : Spun Up
Bus Protocol                    : SAS
Media                           : HDD
Failure Predicted               : No
Revision                        : HT64
T10 PI Capable                  : No
Certified                       : Yes
Encryption Capable              : No
Capacity                        : 136.13 GB (146163105792 bytes)
Used RAID Disk Space            : 136.13 GB (146163105792 bytes)
Available RAID Disk Space       : 0.00 GB (0 bytes)
Hot Spare                       : No
Vendor ID                       : DELL(tm)
Product ID                      : ST9146852SS
Serial No.                      : 6TB1AFDT
Part Number                     : CN0X162K7262213800JTA01
Negotiated Speed                : 6.00 Gbps
Capable Speed                   : 6.00 Gbps
Sector Size                     : 512B
Manufacture Day                 : 05
Manufacture Week                : 10
Manufacture Year                : 2011
SAS Address                     : 5000C500395E44C5

ID                              : 0:0:1
Status                          : Ok
Name                            : Physical Disk 0:0:1
State                           : Online
Power Status                    : Spun Up
Bus Protocol                    : SAS
Media                           : HDD
Failure Predicted               : No
Revision                        : HT64
T10 PI Capable                  : No
Certified                       : Yes
Encryption Capable              : No
Capacity                        : 136.13 GB (146163105792 bytes)
Used RAID Disk Space            : 136.13 GB (146163105792 bytes)
Available RAID Disk Space       : 0.00 GB (0 bytes)
Hot Spare                       : No
Vendor ID                       : DELL(tm)
Product ID                      : ST9146852SS
Serial No.                      : 6TB1AFEY
Part Number                     : CN0X162K7262213800FPA01
Negotiated Speed                : 6.00 Gbps
Capable Speed                   : 6.00 Gbps
Sector Size                     : 512B
Manufacture Day                 : 05
Manufacture Week                : 10
Manufacture Year                : 2011
SAS Address                     : 5000C500395E3C1D
Mike S
sumber
@slm Mengenai hasil edit Anda - apakah ini benar-benar berfungsi tanpa root? Saya tidak memiliki omreport / omconfig di depan saya hari ini, tapi saya tidak yakin ada pengguna yang bisa membuat vdisk. '$' Pada baris perintah menyiratkan pengguna biasa, bukan root.
Mike S
Ya saya hanya melakukan ini beberapa hari yang lalu ketika saya berurusan dengan Dell 730 semua cmds kecuali 2 yang "menciptakan" tidak memerlukan root, saya akan memperbaikinya.
slm
6

Saya juga berjuang untuk membuatnya bekerja di CentOS dan saya menemukan paket yang berfungsi di sini http://mirror.ndchost.com/software/lsi/

disebut " MegaCli-8.07.10-1.noarch.rpm "

Referensi perintah http://hwraid.le-vert.net/wiki/LSIMegaRAIDSAS

Saya harap ini membantu.

Han Solo
sumber
1
Saya sangat setuju, gunakan / opt / megacli / MegaCli64 -PDList -aALL | grep -i firmware dan ia akan memberi tahu Anda jika disk fisik ok. (Perintah dari erikimh.com/megacli-cheatsheet - lihat apakah saya menggunakan yang salah). Pada dasarnya perawatan razia melakukan pekerjaan yang baik untuk memonitor disk, jadi tetap pantau pendapatnya tentang kondisi operasi disk.
Beberapa Linux Nerd
3
smartctl -d megaraid,00 -a /dev/sda
Got MegaRAID inquiry.. FUJITSU MBE2147RC       D906
Device: FUJITSU  MBE2147RC        Version: D906
Serial number: xxxx
Device type: disk
Transport protocol: SAS
Local Time is:
pengguna311347
sumber
8
Silakan mempertimbangkan membaca Bagaimana cara saya menulis Jawaban yang baik? di pusat bantuan kami dan kemudian merevisi Jawabannya. Perintah Anda mungkin secara teknis menjadi solusi, yang juga sudah disebutkan di yang lain, jawaban yang jauh lebih tua dan beberapa penjelasan diterima. Terima kasih sebelumnya.
HBruijn
1
Jawaban lain menggunakan "sat + megaraid", yang tidak berhasil untuk saya. (Benar, saya tidak tahu perintah smartctl dengan baik dan tidak tahu bagaimana mengubah perintah untuk membuatnya bekerja.) Jawaban ini menuntun saya di jalan yang benar, dan itu berfungsi untuk saya.
Yongwei Wu
1

The perccliperintah juga dapat menunjukkan banyak info drive jika Anda bertanya itu baik:

# /opt/MegaRAID/perccli/perccli64 /c0/e32/s0 show all
Controller = 0
Status = Success
Description = Show Drive Information Succeeded.


Drive /c0/e32/s0 :
================

-------------------------------------------------------------------------
EID:Slt DID State DG       Size Intf Med SED PI SeSz Model            Sp
-------------------------------------------------------------------------
32:0      0 UGood -  278.875 GB SAS  HDD N   N  512B ST3300657SS      U
-------------------------------------------------------------------------

EID-Enclosure Device ID|Slt-Slot No.|DID-Device ID|DG-DriveGroup
DHS-Dedicated Hot Spare|UGood-Unconfigured Good|GHS-Global Hotspare
UBad-Unconfigured Bad|Onln-Online|Offln-Offline|Intf-Interface
Med-Media Type|SED-Self Encryptive Drive|PI-Protection Info
SeSz-Sector Size|Sp-Spun|U-Up|D-Down/PowerSave|T-Transition|F-Foreign
UGUnsp-Unsupported|UGShld-UnConfigured shielded|HSPShld-Hotspare shielded
CFShld-Configured shielded|Cpybck-CopyBack|CBShld-Copyback Shielded


Drive /c0/e32/s0 - Detailed Information :
=======================================

Drive /c0/e32/s0 State :
======================
Shield Counter = 0
Media Error Count = 0
Other Error Count = 0
Drive Temperature =  40C (104.00 F)
Predictive Failure Count = 1
S.M.A.R.T alert flagged by drive = Yes

Ini perlu diulang untuk setiap slot enklosur, atau setidaknya saya belum menemukan cara untuk mencetak semuanya sekaligus dengan satu perccliperintah.

Ini juga mudah dipasang dibandingkan dengan opsi lain yang lebih komprehensif:

# curl -C - -O 'https://downloads.dell.com/FOLDER04470715M/1/perccli_7.1-007.0127_linux.tar.gz'
# tar xzvf ../perccli_7.1-007.0127_linux.tar.gz
# cd Linux/
# yum localinstall perccli-007.0127.0000.0000-1.noarch.rpm
# cd /opt/MegaRAID/perccli/

perccliadalah TIDAK pemantauan suite komprehensif seperti Delll OMSA, tapi kedengarannya seperti banyak orang tidak ingin sesuatu yang komprehensif dan bukannya membutuhkan layak, alat sederhana.

Steve Bonds
sumber
-1

Hai Saya punya kartu PERC / LSI Dell yang sama dan saya perlu memeriksa status RAID. LSI memiliki utilitas bernama sas2ircu yang menurut saya cukup berguna, ada juga versi untuk Windows dan Linux.

mike_coreit
sumber