Disk buruk di server kuno

12

Saya memiliki server Netware 3.12 era 1998 yang menjalankan semuanya di kampus kami: buku besar, pembelian, penggajian, informasi siswa, nilai, apa saja. Server memiliki pengontrol Adaptec RAID dengan dua volume:

  1. RAID 1, 2 disk scsi 17GB, Seagate ST318417W
  2. RAID 5, 3 disk scsi 4GB, 2 Seagate ST34573W dan 1 ST34572W.

Kami saat ini sedang dalam tahap awal proyek untuk mengganti sistem ini, tetapi Anda tidak hanya beralih ke sistem baru seperti itu dan jadi saya perlu menjaga server ini berjalan hingga setidaknya November 2011.

Minggu ini kami tidak memiliki satu tetapi dua hard drive gagal. Syukurlah mereka dari volume yang berbeda dan kami dapat terus berjalan untuk saat ini, tetapi mengingat sifat dekat dari kegagalan ini saya memiliki keraguan serius bahwa saya akan dapat menghindari kegagalan bencana dari server ini melalui target November seperti tanpa mengembalikan redundansi RAID - hanya perlu satu kegagalan drive lagi di mana saja dan saya benar-benar disemprot.

Kami cukup beruntung memiliki "suku cadang" yang sama persis di kedua drive, tetapi suku cadang berada dalam kondisi yang tidak diketahui. Saya mencoba bertukar hanya mereka, tetapi pengontrol RAID tidak cukup pintar untuk menangani ini dan itu membuat sistem unbootable.

Sedangkan untuk pengontrol RAID itu sendiri, ada utilitas yang bisa saya masuki selama POST melalui pintasan Ctrl-A, tapi saya tidak bisa melakukan banyak manfaat dari sana. Untuk benar-benar mengelola volume, saya harus boot ke Netware terlebih dahulu, pada titik mana saya dapat menggunakannya CI/O Array Management Software Version 2.0untuk benar-benar melihat informasi volume. Saya menduga bahwa cara normal untuk mengelola berbagai hal adalah dengan boot dari disket khusus dengan perangkat lunak pengontrol di atasnya, tetapi disket itu sudah lama hilang.

Menelusuri opsi dalam perangkat lunak RAID, saya pikir satu-satunya cara yang didukung untuk mengganti disk dalam volume RAID yang ada adalah dengan menambahkan disk secara fisik, mem-boot dan mengonfigurasinya sebagai "cadangan" untuk volume, memaksa volume untuk menggunakan cadangan untuk mengganti disk yang sudah ada (dan pada titik ini saya hanya menebak) sehingga disk yang menjadi cadangan, memperbaiki volume, menghapus cadangan dari volume, dan kemudian menutup dan menghapus disk. Kemudian mulai dari awal untuk disk gagal lainnya. Semua ini berarti banyak downtime, dengan asumsi saya bahkan dapat membuatnya bekerja dan bahwa suku cadang saya bagus.

Adapun untuk mencari suku cadang yang dapat diandalkan, saya tidak tahu di mana harus mulai mencari untuk menemukan drive scsi 4GB baru, atau bahkan sistem scsi yang tepat yang saya cari, karena sudah melalui beberapa iterasi yang berbeda dari waktu ke waktu.

Pilihan lain adalah untuk memigrasikan ini ke mesin virtual (hyper-v), tetapi semua upaya sebelumnya yang kami lakukan di area ini telah gagal berjalan terlalu jauh. Ketika mesin ini dipasang saya baru lulus dari sekolah tinggi, dan karena itu membutuhkan pengetahuan netware dan dos tingkat yang lebih rendah daripada yang pernah saya kembangkan, atau jika saya memang sudah lupa (saya juga bukan dos neophyte, juga).

Bagian dari masalah saya adalah ini adalah server yang banyak digunakan, dan menghapusnya selama beberapa hari untuk mencari tahu tidak akan terbang dengan baik.

Adapun pertanyaan, saya sedang mencari apa pun yang mungkin bisa membantu dalam situasi ini: rekomendasi tentang tempat untuk menemukan suku cadang yang baik dari era ini, pengalaman pribadi memperbaiki volume RAID menggunakan pengontrol yang sama atau membangun hyper-v vm dari sebuah server netware lama, baris pada disket dengan perangkat lunak yang lebih baik untuk pengontrol RAID, rekomendasi untuk konsultan Novell yang baik di Nebraska yang akan dapat memperbaiki keadaan, opsi lain yang belum saya pertimbangkan, dll.

Pembaruan:
Untuk cadangan, kami hanya memiliki cadangan data yang baik (baru-baru ini diverifikasi melalui pemulihan) - tidak ada untuk perangkat lunak yang benar-benar menjalankan banyak hal.

Pembaruan 2:
Hanya laporan kemajuan yang saat ini saya miliki menginstal Netware 3.12 di VMWare Virtual Server 2.0, sebagian besar berkat panduan yang saya temukan di sini:
http://cerbulescubogdan.blogspot.com/2010/11/novell-netware-312 -on-vmware.html

Langkah-langkah selanjutnya adalah mempersiapkan volume netware kosong untuk mencocokkan volume tambahan di server saya yang ada, mengambil semua yang ada di C: \ drive dan volume netware di server saya yang ada, dan mencari tahu dari informasi itu modul apa yang perlu ditambahkan ke netware, menginstal lisensi saya (kami masih memiliki disk itu, jika ada gunanya), dan memindahkan data.

Saya memiliki persetujuan untuk menurunkan server selama satu minggu setelah tahun pertama (sayangnya tidak sebelumnya), jadi, selain membuat volume kosong, sisa pekerjaan harus menunggu sampai saat itu.

Pembaruan Akhir (5 Jan 2011):
Saya bisa membuat suku cadang bekerja di kedua array serangan tanpa kehilangan data minggu ini. Keduanya sekarang terdaftar oleh controller sebagai "FAULT TOLLERANT" (yay!). Saya juga dapat membangun kemajuan dari pembaruan terakhir saya dan sekarang memiliki server "cadangan" fungsional di VMWare Server 2.0. Cadangan dapat berjalan dan menggunakan perangkat lunak erp kami, tetapi saya tidak dapat memproduksinya karena saya belum dapat (dari) mencetak dari kotak itu (dan saya tidak tahu mengapa). Meski begitu, VM ini akan melakukan dalam keadaan darurat jika saya tidak punya pilihan lain, dan di antara itu dan array RAID yang diperbaiki saya nyaman hidup dengan situasi sampai saya bisa membuang mesin pada bulan November.

Epilog (16 Jan 2012):
Proyek untuk mengganti server ini dengan sistem yang sepenuhnya baru berjalan sesuai rencana. Hore tanpa netware lagi! Semua berasal Server Sql! Raja telah meninggal. Panjang umur raja!

Kami masih berencana untuk menjaga server lama berjalan lebih lama, sampai setelah audit tahun fiskal kami selesai pada bulan Agustus. Tetapi jika kegagalan terjadi antara sekarang dan kemudian, tidak ada yang akan mengeluh terlalu banyak.

Joel Coel
sumber
1
Apa pertanyaannya?
andyhky
Lihat paragraf terakhir
Joel Coel
2
Seperti orang lain, saya kehilangan minat jauh sebelum saya mencapai paragraf pertanyaan. Anda mungkin ingin mempertimbangkan memformat ulang semuanya untuk mengajukan pertanyaan saya lebih awal atau menyingkatnya.
John Gardeniers
2
Saya ingin menempatkan ini dalam perspektif (yang mungkin sudah Anda ketahui): Operasi SELURUH Anda bergantung pada satu mesin berusia 12 tahun yang tidak dapat Anda ganti selama setahun penuh. Anda punya masalah.
Jeff Ferland
2
Terima kasih atas pembaruan pada proyek Anda. Saya senang mendengar bahwa migrasi Anda berhasil.
Bintang laut

Jawaban:

12

Dapatkan (dan terus dapatkan, setiap hari atau lebih sering) backup yang baik dari data file bersama sekarang . Jika Anda kehilangan mesin, Anda mungkin tidak akan dapat menemukan disket yang diperlukan (ya) untuk mengembalikannya. Dapatkan salinan partisi DOS yang digunakan Netware, jika memungkinkan juga.

Kedengarannya seperti kartu RAID Adaptec AAA-131 (atau sesuatu dari zaman itu). Jika saya benar Anda tidak akan menemukan perangkat lunak manajemen yang jauh lebih baik karena tidak ada (lihat http://www.adaptec.com/en-us/downloads/novell_netware/novell_netware/productid=aaa-131&dn=aaa-131 .html untuk versi terakhir yang tersedia). Saya menggunakan banyak kartu itu "kembali pada hari" dan mereka bekerja dengan baik.

Jika itu adalah AAA-131 berhati-hatilah saat bermain dengan konfigurasinya . Tidak ada cara untuk mengkonfigurasi set RAID tanpa menghapus disk pada kartu tersebut. Itu berarti, misalnya, jika Anda mengambil kotak itu dan melampirkan beberapa disk uji dan, katakanlah, hapus konfigurasi dan buat set RAID pada mereka, ketika Anda pasang disk "produksi" kembali tidak akan ada cara untuk menggunakannya tanpa kartu memformatnya terlebih dahulu. Ya. Seburuk itu.

Novell Netware akan berjalan di hypervisors VMware. Saya akan merekomendasikan kontrak dengan seseorang yang memiliki pengalaman Novell Netware yang layak (ada orang-orang di sini - saya sedang melihat Anda, Sysadmin1138 - yang memilikinya) untuk membantu Anda mendapatkan konten server yang dipindahkan ke lingkungan virtual di mana , setidaknya, Anda bisa terus melakukannya.

Jika komputer klien Anda modern dan memiliki klien jaringan Microsoft yang diinstal, Anda mungkin menemukan bahwa bermigrasi ke mesin berbasis Windows Server sebenarnya akan cepat dan mudah. Bawa mesin Windows Server dengan nama yang sama dengan server Netware, buka struktur direktori bersama dengan konvensi penamaan UNC yang sama dengan mesin Netware, salin semua file, dan duplikat izin pada mesin tujuan (dengan tangan). Mungkin tidak terlalu sulit untuk dilakukan dan Anda bisa "tahap" migrasi di laboratorium pengujian sebelumnya dan menguji beberapa klien dengan itu untuk memutuskan apa yang perlu diubah dari perspektif lingkungan skrip / pengguna.

Anda mungkin bisa mendapatkan beberapa perangkat keras cadangan dari eBay. Namun, apa pun yang Anda beli dari vintage itu, akan memiliki masalah keandalan.

Jika saya jadi Anda, saya akan membuat seseorang yang baik dengan Windows Server di sana untuk membantu Anda melakukan tahapan migrasi jauh dari kotak itu SEKARANG . Kasing mungkin dapat dibuat kepada manajemen untuk menghabiskan sejumlah uang dengan memberikan bahwa Anda dapat kehilangan seluruh isi kotak Netware kapan saja. Kotak pengganti tidak perlu tenaga kuda besar (mengingat apa yang Anda ganti) sehingga perizinan dan cadangan perangkat lunak akan menjadi biaya terbesar Anda. Masalah migrasi yang berhubungan dengan klien dapat diminimalkan dengan menggunakan konsultan yang baik dengan skrip dan dapat merencanakan rincian perubahan pengaturan terkait klien melalui skrip masuk dan skrip startup.

Evan Anderson
sumber
Perangkat lunak manajemen kampus yang kami jalankan di mesin ini memerlukan direktori Novell untuk pengaturan keamanannya, jika tidak, saya hanya akan AD dalam sekejap. Saya akan diingat tidak terlalu banyak bermain dengan pengontrol RAID.
Joel Coel
4
@ Joel Coel: Yeeouch. Itu menyebalkan. Dapatkan virtualisasi secepat mungkin, lalu. RAID controller yang lama itu akan menyediakan BIOS Int 13 yang memungkinkan alat pencitraan disk DOS (seperti GHOST untuk DOS) berfungsi dengan baik. Saya akan mendapatkan gambar sektor-untuk-sektor dari semua partisi Netware dan kemudian meminta seseorang untuk membantu Anda memindahkannya ke disk virtual untuk hypervisor pilihan Anda.
Evan Anderson
Sedang mengerjakan jawaban sekarang.
sysadmin1138
10

Saya tahu, karena saya telah melakukannya (Hai Evan), VMWare memang memiliki dukungan NetWare yang layak. Bahkan untuk hal-hal yang sangat lama (apa yang Anda jalankan). NetWare dari vintage yang NOOP CPU saat idle bukan HALTing, jadi CPU apa pun yang diberikan dalam VM akan dipatok. Inilah gunanya Alat VMWare, mereka membuatnya tidak melakukan itu. VMWare telah ada sejak tahun 90-an (dan bahkan telah memiliki stan di BrainShare selama beberapa tahun) dan harus melakukannya, ini sebabnya mereka mendapat dukungan. Virtualisasi Microsoft cukup baru sehingga mereka tidak pernah harus memvirtualisasi NetWare, sehingga tidak berfungsi di sana.

Jika server ini sama pentingnya dengan yang Anda katakan, melompati untuk beberapa lisensi VMWare harus mudah dijual. Paling tidak, muncul lisensi VMWare Workstation, yang setidaknya akan membuat server ini masuk ke lingkungan virtual. VMWare Server gratis (saya percaya) jika Anda benar-benar harus. Setelah pekerjaan itu selesai, Anda dapat mempertimbangkan untuk memindahkannya ke sesuatu seperti ESXi hingga dapat diganti secara formal.

Ada opsi lain, tergantung pada kemampuan Linux Anda. Novell telah menghabiskan beberapa waktu untuk mendapatkan Xen (bukan KVM, Xen, meskipun keduanya menggunakan qemu) untuk mendukung NetWare. Ini mungkin akan bekerja dengan NW3.12, meskipun Anda harus memastikan Anda menggunakan mode virtualisasi penuh , bukan paravirtualization.

Server yang cukup baru itu harus memiliki drive CD-ROM di dalamnya, yang mungkin akan menyelamatkan Anda. Setelah cadangan Anda selesai, boot ke ISO-Linux jika pilihan Anda. Tidak akan bisa mendapatkan data, tetapi harus melihat hard drive. Pada titik itu, lakukan yang lengkapdd salinan kedua volume ke tempat lain di jaringan Anda. Gambar-gambar drive tersebut dapat digunakan secara langsung oleh qemu sebagai drive virtual.

Ada cara untuk mengkonversi gambar yang dihasilkan oleh dd ke dalam VMware VMDK, tetapi saya belum menggunakannya sendiri. Google mereka, mereka ada di luar sana.

sysadmin1138
sumber
Beberapa kartu RAID Adaptec lama tidak didukung oleh Linux. OP mungkin macet menggunakan utilitas pencitraan DOS (untuk memanfaatkan BIOS Int13 kartu). Utilitas dd-to-vmdk yang baik yang saya gunakan adalah: sourceforge.net/projects/raw2vmdk
Evan Anderson
Memang ada CD drive, tapi ternyata drive itu tidak berfungsi :(
Joel Coel
5

Ini tidak benar-benar membantu dalam hal pertanyaan Anda (terus terang Anda sudah MEMILIKI suku cadang, dan satu-satunya saran yang berguna yang saya miliki untuk sumber disk vintage akan menjadi " Masukkan nomor model drive ke Google Shopping "), tetapi sebelum Anda menyentuh hal lain Anda harus benar-benar PASTIKAN ANDA MEMILIKI CADANGAN YANG BAIK DAN DAPAT BERHASIL MENGEMBALIKANNYA KE MESIN BARU DI NEGARA YANG DAPAT DIGUNAKAN .

Jika mesin ini sepenting kedengarannya dari deskripsi Anda, itu harus menjadi prioritas nol Anda saat ini. Jika Anda belum melakukan tes pemulihan yang berhasil pada cadangan Anda dalam beberapa saat, Anda harus menganggap itu tidak berharga, dan Anda perlu memastikan bahwa Anda benar-benar dapat memulihkan jika mesin ini mengocok yang terakhir dan mati pada Anda.
Jika disk lain jatuh mati pada Anda dan Anda tidak memiliki cadangan yang dapat digunakan itu cukup banyak ballgame. Anda akan segera pindah ke sistem baru, apakah Anda siap atau tidak.

Hanya $ 3,50 saya.

voretaq7
sumber
Sepakat. Uji kemampuan pemulihan Anda. # 1 Hal Pertama. Tanpa cara untuk memulihkan, Anda mungkin juga tidak memiliki cadangan. (Berada di sana, melakukan itu. Menyebalkan. Jangan lakukan itu.)
minamhere
2

Orang lain telah menangani backup, dll., Jadi saya tidak akan mengulanginya lagi. Ada beberapa hal yang dapat Anda lakukan untuk meningkatkan peluang sistem Anda terus berfungsi.

Mulailah dengan berinvestasi dalam filter saluran berkualitas tinggi dan tempatkan antara UPS dan server. Drive lama itu sekarang akan agak sensitif tentang lonjakan, lonjakan dan bahkan fluktuasi pasokan yang cukup kecil.

Saya melihat dari Anda pembaruan bahwa Anda telah menginstal drive cadangan tetapi ini adalah apa yang saya sarankan: Sebelum mencoba drive cadangan di server meletakkannya di mesin lain dan menekankan omong kosong dari mereka dengan perangkat lunak burn-in atau, jika Anda tidak bisa mendapatkan hal itu, siklus pengujian berkelanjutan menggunakan perangkat lunak tes drive biasa. Pertahankan setidaknya selama beberapa hari sebelum menyatakan drive dapat dipercaya. Drive lama yang telah tersimpan terkenal tidak bisa diandalkan dan bisa gagal dengan mudah.

John Gardeniers
sumber
1

Saran bagus di atas. Coba ini juga - pada perangkat keras modern cadangan, coba lakukan pemulihan seluruh sistem dari cadangan penuh terakhir Anda. Pastikan mesin cadangan tidak ada di jaringan.

Apa itu, saya khawatir Anda mungkin mengatakannya? Anda tidak memiliki cadangan dan / atau prosedur pengembalian? Nah, sekarang Anda tahu apa yang Anda kerjakan untuk minggu depan?

mfinni
sumber
1

Menjawab hanya untuk dua kali lipat / tiga kali lipat / merekomendasikan merekomendasikan membuat cadangan setiap hari sampai Anda menemukan solusi. Jika Anda tidak dapat dengan mudah mengganti drive mati, satu-satunya solusi Anda adalah bermigrasi ke drive baru. Apakah itu berarti membangun server baru, atau secara perlahan memigrasi server Anda yang ada untuk menggunakan drive baru di server Anda yang ada, itu satu-satunya pilihan.

Kami memiliki 2 dari 3 hard drive gagal dalam satu malam dalam array RAID 5 7 tahun. Cadangan kami sangat ketinggalan zaman. 8 hari dan $ 17.000 kemudian, perusahaan pemulihan data dapat memulihkan seluruh server Exchange kami, tetapi tidak ada yang senang. (Kecuali saya, karena saya seharusnya membuat cadangan setiap hari. Ke perangkat keras yang saya minta tetapi tidak ada yang mau membeli untuk saya, tetapi fakta itu hilang pada orang lain ...)

Satu hal yang baik untuk datang dari ini adalah bahwa klien segera menyetujui permintaan pembelian 6 bulan saya untuk perangkat keras pengganti. Tapi, sial, itu adalah 8 hari yang sangat menegangkan. Bantulah diri Anda sendiri, buat cadangan sekarang, dan mulailah mengerjakan kemungkinan "bangun dan jalankan perangkat keras apa pun yang dapat Anda temukan di kantor" sekarang dengan rencana cadangan.

minamhere
sumber