Di sini kami memiliki beberapa server dan hampir masing-masing memiliki UPS khusus. Ada dependensi di antara mereka sehingga mereka harus diaktifkan dalam urutan yang benar. Pada akhirnya kami mengalami masalah serius dengan catu daya, sehingga server dimatikan dan kemudian dimulai kembali secara acak ketika daya dipulihkan. Ini bukan masalah jika server dimatikan selama pemadaman, penting mereka bekerja dengan benar tanpa campur tangan manusia begitu daya dipulihkan.
UPS kami cukup murah dan satu-satunya parameter konfigurasi yang berguna untuk tujuan saya adalah power the load xx seconds after power is restored
. Secara teori menempatkan penundaan yang tepat pada setiap UPS saya dapat memperbaiki urutan restart server tapi saya tidak percaya UPS akan berperilaku seperti yang diharapkan.
Apakah ini cara yang tepat untuk pergi?
Apakah UPS tingkat tinggi memberikan opsi lain untuk memperbaiki urutan restart?
Satu catatan terakhir: UPS saya ada di kisaran 1000 - 2200 VA
systemd
- kemampuan untuk menentukan dependensi yang tepat dalam proses startup. Tunggu hingga layanan X tersedia sebelum mencoba memulai layanan Y.systemd
contoh yang sama dan tidak untuk layanan yang berjalan di server yang sama sekali berbeda ...Jawaban:
Jawaban standar untuk ini adalah "tidak sama sekali". Perbaiki perangkat lunak untuk menangani restart secara acak. Jika Anda benar-benar membutuhkan BEBERAPA server untuk memulai lebih dulu (contoh: Active Directory) letakkan di USV yang mungkin bertahan lebih lama. Server berbasis atom berdaya rendah cukup baik sebagai pengontrol Direktori Aktif dan akan bertahan sehari dengan USV kecil.
Tidak. Saya akan mengatakan bahwa umumnya diasumsikan programmer cukup kompeten untuk mengatasi masalah dengan benar.
Apa yang BISA Anda lakukan adalah:
Saya akan mengatakan bahwa jenis pengaturan ini jauh lebih umum. Saya akan menyebut perangkat lunak apa pun yang MEMBUTUHKAN server mulai dalam urutan tertentu (di luar infrastruktur murni) sebagai rusak dan tidak layak untuk bisnis.
Sama seperti catatan: setup kita sendiri adalah biaya rendah 20kva USV (biaya rendah karena kita punya satu digunakan) untuk server, dengan 2000VA USV budak untuk mesin yang berfungsi sebagai "root" dari jaringan (dan mesin cadangan). Slaved berarti bahwa USV berada di belakang yang besar - sehingga hanya beralih ke baterai ketika yang besar (yang berlangsung antara setengah jam dan 8 jam tergantung pada seberapa banyak jaringan komputasi kita yang online) akan memasuki terminal shutdown.
sumber
Unit Distribusi Daya yang Dikelola (alih-alih UPS) sering mendukung penundaan khusus dalam memungkinkan outlet individu setelah daya dilanjutkan.
Biasanya itu adalah untuk mencegah pemutus sirkuit dari tersandung ketika kabinet penuh sistem menyala pada saat yang sama segera setelah daya dipulihkan, tetapi itu juga dapat digunakan untuk mempertahankan urutan boot dari ketergantungan sistem Anda.
sumber
Saya punya masalah persis ini. Satu-satunya perbedaan adalah kami berinvestasi pada unit daya APC yang dipasang di rak yang kokoh (misalnya APC SmartUPS 3000 ). Dengan perangkat lunak penutupan jaringan APC PowerChute (perangkat lunak PowerChute Network Shutdown) , saya dapat mematikan dan membuka server dalam urutan tertentu. Fitur lain yang berguna dari perangkat lunak ini adalah mengatur server untuk dimatikan pada menit terakhir, yaitu menghitung berapa banyak daya baterai unit APC yang tersisa dan mematikan server dengan waktu yang cukup bagi mereka untuk dimatikan dengan benar alih-alih hanya mematikan.
Perangkat lunak ini ... tidak ramah pengguna tetapi tidak sulit jika Anda meluangkan waktu untuk mengetahuinya. Jika Anda tertarik untuk berinvestasi lebih banyak dalam infrastruktur Anda, ini jelas merupakan jalan yang harus ditempuh.
sumber
Kedengarannya seperti unit UPS berbiaya rendah dan tidak mampu dikonfigurasikan untuk waktu tunggu output-on tertentu setelah daya dipulihkan (beberapa unit akhir yang lebih tinggi). Untuk mendapatkan fungsionalitas yang sama, Anda harus memilih host tertentu untuk selalu menyala segera (mungkin sistem mana pun yang diizinkan untuk boot kapan saja) dan meninggalkan semua server lain dalam keadaan mati (dikonfigurasi dalam bios untuk kembali berkuasa mati ketika AC diterapkan, dan untuk menghormati paket ajaib Wake On Lan untuk menghidupkan ketika disuruh melakukannya). Kemudian, pada host utama yang melakukan boot, jalankan skrip / utilitas untuk mengatur waktu pengiriman paket ajaib WOL ke setiap host.
sumber