Server Dell PowerEdge jatuh, bagaimana cara memperbaikinya? Apa yang terjadi? Informasi di dalam

8

Saya saat ini di sekolah menengah dan menjalankan situs web sekolah kami. Musim panas ini, SysAdmin kami didiagnosis menderita kanker, dan ia pergi berobat, jadi saya telah dilemparkan ke dalam situasi yang menarik.

Saya benar-benar tidak yakin apa yang salah dengan server web ini, tetapi saya akan senang dengan ide / pengajaran / masukan Anda karena saya mencoba untuk dengan cepat belajar sehingga saya dapat membantu.

Server berlari / menjalankan FreeBSD, yang mungkin tidak berarti apa-apa karena ini adalah masalah perangkat keras. Saya tahu pada satu titik server memiliki lima drive identik di dalamnya (apakah itu berarti Raid-5?), Tetapi pada titik crash ada tiga drive yang berfungsi di dalamnya ("berjalan dalam mode terdegradasi?").

Sekitar seminggu yang lalu, server tidak mau memulai karena hanya menemukan 1 drive logis. Saya menjalankan utilitas konfigurasi dan melihat ini:http://i.stack.imgur.com/IL6ut.jpg

Saya berasumsi masih ada beberapa data yang tersisa pada drive yang hidup itu, kan? (Saya punya cadangan dari web fies, hanya saja bukan pengaturan OS dan Server Web yang sebenarnya).

Jika ada informasi yang perlu saya tambahkan sehingga Anda dapat lebih menjelaskan apa yang terjadi pada saya, saya lebih dari bersedia untuk melakukan itu. Saya hanya ingin memahami apa yang terjadi, apa ini pada satu titik, dan bagaimana saya bisa mengambil tindakan untuk memperbaikinya.

Terima kasih banyak.

ankurkdotcom
sumber
2
Sedih sekali :( belasungkawa saya ... Periksa data dan kabel daya pada semua drive, backplane dan controller, masukkan kembali disk. Jika mungkin, hubungkan drive ini ke komputer lain (JANGAN FORMAT), periksa apakah mereka dikenali.
GioMac
oh, ini scsi, tidak mudah untuk terhubung ke sistem lain :( mungkin drive terlalu lama dan mati.
GioMac
Jika itu semua tidak akan membantu dan jika itu layak - Anda dapat mencoba menghubungi perusahaan yang menyediakan layanan pemulihan HDD.
GioMac
2
Rute Anda ke sysadmin sangat mirip dengan rute saya. Semoga beruntung untuk masa depan, itu menjadi lebih baik. Sayangnya, beberapa hari pertama Anda akan sangat tidak menyenangkan karena Anda harus mengganti semua drive di server ini (menambahkan yang lain sebagai cadangan panas), dan memulihkan dari cadangan.
Tom O'Connor

Jawaban:

12

Pertama, belasungkawa saya pada rawat inap mentor Anda dan pembaptisan Anda dengan api ke dalam administrasi sistem.

Kedua, belasungkawa saya atas kehilangan data Anda. Saya sangat berharap Anda memiliki cadangan.


Untuk meringkas situasi Anda:

Anda memiliki array RAID tiga drive (mungkin RAID-5 ).
Ini adalah salah satu "Logical Drive" (3 disk ditangani oleh pengontrol RAID, dan disajikan ke seluruh sistem seolah-olah mereka adalah satu drive).

Anda telah kehilangan dua dari tiga drive dalam array, dan RAID-5 tidak bisa mentolerir dua drive gagal. (Lihat posting yang saya tautkan sebelumnya untuk informasi lebih lanjut.)

Untuk semua maksud dan tujuan data Anda tidak dapat dipulihkan - satu-satunya cara untuk memulihkan data dari sistem ini adalah dengan mengirimkan ketiga drive ke perusahaan pemulihan data (prospek yang mahal).

Jika Anda memiliki cadangan, Anda dapat memulai proses membangun kembali sistem pada disk baru.
Cadangan yang baik harus membuat proses pemulihan relatif tidak menyakitkan (meskipun tergantung pada sistem dan apa yang dilakukan - email, DNS, dll. - yang mungkin masih merupakan proyek).

Jika Anda tidak memiliki cadangan, Anda diharapkan memiliki setidaknya salinan situs web (pada workstation tempat Anda kembangkan?) Dan dapat mengatur lingkungan server baru dan mengunggah situs web Anda di sana, atau sebagai alternatif, menyewa ruang web hosting bersama untuk di Setidaknya kembalikan keberadaan web sekolah Anda.

Jika Anda memiliki pengalaman administrasi sistem yang terbatas dan tidak ada yang bekerja dengan Anda dalam hal ini, saya akan merekomendasikan rute hosting bersama.

voretaq7
sumber
mike, apakah Anda tahu controller yang mana ini? apakah dapat dipulihkan / kompatibel dengan dmraid?
GioMac
6
Tidak mengatakan itu akan bekerja di sini, tetapi jika Anda tahu drive mana yang gagal terakhir , jika utilitas config memungkinkan Anda untuk memaksanya "Online", Anda mungkin bisa cukup mem-bootnya untuk mengambil cadangan yang baik. Terkadang drive ditandai sebagai "Gagal" oleh pengontrol tetapi belum sepenuhnya Fubar.
TheCleaner
1
@TheCleaner benar - pengontrol PERC Dell sangat terkenal karena hal ini - mereka offline drive untuk kesalahan lunak sepanjang waktu. Kuncinya adalah mengaktifkan kembali salah satu yang gagal TERAKHIR:
Lakukan