Haruskah saya khawatir tentang pengaturan server kami?

9

Saya bekerja untuk sebuah perusahaan dengan sekitar 50 orang. Dua server kami (identik) dibuat khusus dengan spesifikasi ini:

Xeon E3-1270 V3
Intel Entry Server Board
32 GB DDR3 ECC
2x 256 GB SSD RAID1 (for System)
4x 1TB SSD RAID10 (for Hyper-V VMs)
Windows Server 2012 R2 as Host and VMs

Setiap server memiliki dua VM (2x AD + berbagi file + profil roaming, 1x SQL server untuk pengujian, 1x lainnya (tidak penting).

Kami melakukan pencadangan harian menggunakan Pencadangan Windows bawaan pada target iSCSI yang di-host pada QNAP NAS (2x1TB RAID1).

Server tidak memiliki banyak muatan dan kami tidak pernah mengalami masalah. Sebagian besar data kami disimpan di cloud (VS Online, SharePoint).

Tetapi saya bertanya-tanya apakah masuk akal melanjutkan pengaturan ini atau apakah lebih baik beralih ke perangkat keras server profesional, yaitu satu mesin besar.

Jadi apa jebakan dan apa yang harus saya lakukan?

Martin Walter
sumber
2
" Tapi saya bertanya-tanya apakah masuk akal melanjutkan pengaturan ini atau apakah lebih baik beralih ke perangkat keras server profesional, yaitu satu mesin besar. " Ini adalah dua pertanyaan yang agak berbeda, jika Anda juga mencari jawaban komprehensif untuk pertanyaan terakhir maka mungkin layak berpose secara terpisah. Selain itu, dapatkah Anda mengklarifikasi peran Anda dalam organisasi? Saya berasumsi Anda bertanggung jawab atas infrastruktur tetapi jika tidak, Anda jelas tidak perlu melakukan apa pun.
Lilienthal
1
Saya dapat memikirkan beberapa jawaban berbeda di sini sehingga mengidentifikasi pertanyaan inti (apakah pengaturan ini ok? Apakah perangkat keras ini ok? Haruskah kita menggabungkan layanan? ...) dapat membantu Anda mendapatkan jawaban yang lebih berguna.
Lilienthal
@Lilienthal Saya adalah admin utama perusahaan. Ya, saya ingin tahu apakah perangkat keras dan pengaturannya ok.
Martin Walter
Apakah pengaturannya ok adalah topik yang cukup luas karena melibatkan banyak faktor: Apakah Anda memiliki cadangan offline dan / atau offsite? Apakah Anda memiliki strategi pemulihan? Sudahkah Anda menguji kata strategi pemulihan? Waktu henti apa yang bisa Anda makan? Berapa anggaran Anda dan tingkat layanan yang diharapkan? Seperti apa proses pembaruan dan peningkatan Anda? Apakah sistem dan kredensial Anda didokumentasikan? Sudahkah Anda mempertimbangkan faktor bus? ... Itu pertanyaan yang sangat berbeda dari "kapan masuk akal untuk meninggalkan perangkat keras konsumen?"
Lilienthal
1
@Lilienthal Lol. Saya suka bagaimana Anda menangkap diri Anda sendiri pertengahan paragraf. Ya itu yang saya maksud.
Ryan Babchishin

Jawaban:

11

Sepertinya Anda sudah menggunakan perangkat keras yang layak. Apakah ada yang salah? Itu tidak terlalu tua kan? Simpan barang-barang Anda dalam garansi atau tutup, jika Anda tidak ingin merasa terlalu khawatir (tidak semua orang berbagi pendapat saya tentang ini).

Jika Anda memiliki pengaturan barang yang cadangannya berlebihan dan bagus, Anda melakukannya dengan cukup baik. Satu server = satu titik kegagalan, betapapun baiknya, itu akan membuat saya tidak nyaman. Ada banyak hal yang dapat Anda lakukan dengan anggaran terbatas dengan membuat keputusan cerdas tentang bagaimana hal-hal diterapkan perangkat lunak / perangkat keras / infrastruktur / dukungan bijaksana.

Jika Anda tidak memiliki tindakan pencegahan / hal-hal di tempat, mungkin Anda harus khawatir. Jika satu sistem mati, apakah layanannya hilang? Bagaimana itu mempengaruhi bisnis? Seberapa cepat Anda bisa pulih?

Perangkap? Tergantung. Anda tidak memberikan terlalu banyak info. Drive murah bisa gagal atau lambat. Kasing murah bisa terlalu panas. Penggemar murah bisa gagal. Pengontrol SATA / SAS / RAID murah dapat mengacaukan atau tidak melakukan seperti yang diharapkan. Catu daya murah bisa mati atau jika tidak berlebihan, membuat Anda tanpa daya. Motherboard dapat melakukan hal-hal miring. Sistem tanpa konsol jarak jauh (ILO, dll.) Dapat menjadi masalah untuk dikelola. Kartu jaringan murah dapat memiliki driver murah atau gagal. Banyak masalah kecil yang tidak terduga dapat terjadi. Di sisi lain, Anda bisa mendapatkan barang-barang entry level yang murah yang berkinerja luar biasa. Dan hal-hal yang lebih mahal kadang-kadang juga bisa menjadi miring.

Saya telah melihat semuanya, di server kelas * yang layak, server kelas bawah, workstation, dan peralatan kelas konsumen. Hal-hal yang lebih tinggi tampaknya lebih baik dalam jangka panjang (garansi masa lalu). Tetapi jika Anda tidak mampu membelinya? Atau Anda hanya dapat membeli satu server dan tidak dapat menerapkan redundansi yang tepat?

Pada dasarnya tidak ada yang salah dengan server ganda yang berjalan dengan Xeon, memori ECC dan RAID. Kecuali jika Anda memiliki masalah dengannya.

Ryan Babchishin
sumber
Mungkin bermanfaat untuk pertama-tama mendefinisikan tujuan (hal-hal yang benar-benar Anda butuhkan, hal-hal yang menyenangkan untuk dimiliki dan hal-hal yang tidak terlalu mengganggu Anda) dan anggaran lalu membeli kualitas terbaik yang memenuhi kriteria tersebut. Selain itu, saya pribadi tidak akan menyentuh apa pun tanpa manajemen jarak jauh (IPMI, AMT, dll) lagi, itu terlalu nyaman. Hal yang sama berlaku untuk catu daya yang berlebihan, terutama untuk host VM di mana shutdown cukup memakan waktu.
user121391
9

Dengan asumsi VM Anda berlebihan (dan ini diuji sebagai bekerja dengan satu simpul mati), Anda mungkin relatif kebal dari pemadaman perangkat keras terkait dengan memiliki dua node cermin.

Tanpa tahu lebih banyak, saya tidak akan merekomendasikan dropping ke kotak (baru) tunggal kecuali pemadaman seluruh node bukan masalah besar di perusahaan Anda.

Yang mengatakan, akan sangat membantu untuk mengetahui beberapa detail tambahan tentang lingkungan Anda ... seperti, berapa lama Anda memiliki mesin ini, apakah mereka berada di lingkungan yang dibangun khusus (bersih, ruang kering dengan rak & AC dll) . Seperti yang mungkin Anda sadari, peralatan yang dirawat dengan baik akan bertahan lebih lama!

Secara umum, tidak ada yang salah dengan menggunakan perangkat keras yang kurang 'profesional', hanya saja tidak disertai dengan jaminan atau keandalan yang sama dengan perangkat yang lebih mahal, dan risiko ini harus ditimbang terhadap anggaran Anda.

Matt Renner
sumber
2
Terima kasih atas jawaban anda. Kami memiliki server selama 3 tahun sekarang saya pikir. Mereka berada di rak di kamar khusus dengan AC. Server tidak dicerminkan sekalipun. Setiap server host VM yang berbeda, dengan masing-masing hosting satu AD.
Martin Walter
Dalam hal itu (sepertinya Anda melakukan pekerjaan yang baik untuk menjaga mereka) maka saya pikir Anda cukup aman untuk melanjutkan seperti sekarang (dengan asumsi AD adalah satu-satunya layanan penting yang Anda hostingkan pada mereka). Saya akan merekomendasikan menerapkan semacam pemantauan untuk mengawasi kesalahan perangkat keras (Saya tidak yakin apa yang paling tepat untuk Windows hari ini) dan mungkin berencana untuk menggantinya atau datang dengan solusi yang berbeda dalam 2-3 berikutnya. tahun.
Matt Renner
4
@ MartinWalter Mungkin Anda harus khawatir. Satu sistem mati, layanannya hilang. Bagaimana itu mempengaruhi bisnis? Seberapa cepat Anda bisa pulih?
Ryan Babchishin
1
@RyanBabchishin Pertanyaan itu selalu yang penting untuk in-house IT. Namun, secara realistis selalu ada pertukaran, dan untuk bisnis, turun selama satu atau dua jam mungkin dapat diterima pada kesempatan langka itu. Juga, jika OP memiliki snapshotted VM-nya / diekspor ke perangkat eksternal, pemulihannya sesederhana memasang perangkat eksternal itu di kotak berjalan lainnya, dan mem-booting vm-nya sementara. Untuk AD, ini kemungkinan tidak akan menyebabkan masalah (jika semua penanganannya adalah hal-hal dasar AD, tidak ada yang maju) selain mengurangi kinerja hingga pemulihan mesin utama.
SnakeDoc
1
@SnakeDoc Itu sebabnya itu pertanyaan ... baginya. Tentang itu. ?
Ryan Babchishin
5

Karena backend penyimpanan Anda adalah semua-flash, perangkat keras Anda benar-benar OK untuk beban kerja yang disebutkan. Satu-satunya masalah yang saya miliki mengenai konfigurasi Anda bahwa VM Anda terpecah dan berjalan pada satu server alih-alih dicerminkan / disinkronkan antara server terutama jika mereka identik. Jadi saya sangat menyarankan Anda untuk menggunakan beberapa penyimpanan yang ditentukan perangkat lunak (SAN virtual) yang akan memungkinkan Anda bergabung dengan kedua server menjadi satu cluster dan membuat mesin virtual Anda kebal terhadap kemungkinan kegagalan perangkat keras.

Opsi yang mungkin adalah HP VSA http://www8.hp.com/us/en/products/storage-software/product-detail.html?oid=5306917 atau EMC Unity VSA https://store.emc.com/us/ Product-Family / EMC-Unity-Products / EMC-Unity-VSA / p / EMC-Unity-Virtual-Storage-Appliance yang gratis tapi sejauh yang saya tahu tidak diizinkan untuk produksi. Karena Anda menggunakan Hyper-V pilihan yang sempurna bagi Anda adalah dengan menggunakan StarWind Virtual SAN https://www.starwindsoftware.com/starwind-virtual-san yang berjalan secara native di atas jendela dan memungkinkan Anda untuk membuat mulus sepenuhnya fungsional Microsoft Failover Hyper-V cluster hanya menggunakan penyimpanan yang terpasang langsung.

Saya juga akan merekomendasikan menggunakan VEEAM B&R https://www.veeam.com/vm-backup-recovery-replication-software.html yang memiliki versi gratis atau Bacula http://blog.bacula.org/ untuk mencadangkan VMs Anda sebagai gantinya menggunakan asli Windows 2012 Server Backup karena dikenal menyebabkan masalah ketika mencoba untuk memulihkan VM Anda.

Pelari Net
sumber
1
Terima kasih atas sarannya. Saya tahu cadangan adalah sesuatu yang harus saya tangani. Failover tidak mungkin saat ini, karena mesin menjalankan VM yang berbeda dan tidak memiliki banyak RAM, jadi saya tidak bisa meletakkan semua VM di satu mesin.
Martin Walter
1
Ingin mendengar lebih banyak tentang masalah yang Anda sebutkan tentang memulihkan VM dengan Windows 2012 Server Backup
wandersick
1
@wandersick Sebenarnya masalah umum. Windows Backup dikenal karena memunculkan kesalahan aneh seperti 0x8XXXXXXX selama pemulihan sehingga pemulihan menjadi tidak mungkin. Hal aneh adalah bahwa kadang-kadang ada kode kesalahan bahkan tidak googlable :-(
Net Runner
0

Dalam penyebaran kecil, umumnya lebih baik memiliki beberapa (setidaknya 2) mesin lebih murah daripada yang mahal. Atau dengan kata lain, dalam penyebaran kecil lebih baik lebar daripada tinggi. Alasannya adalah bahwa dengan cara ini Anda memiliki redundansi untuk kenaikan biaya yang terbatas. Dua 3000, - server mungkin dapat melakukan hal yang sama seperti satu 5000, - server, tetapi jika server yang mahal gagal Anda bertulang. Jika salah satu yang lebih murah gagal Anda setidaknya memiliki setengah dari VMs Anda masih berjalan, dan mungkin dapat menjalankan yang lain juga, itu hanya akan lambat.

Yang harus Anda perhatikan adalah tidak mengelola server-server ini satu per satu, tetapi entah bagaimana mengelompokkannya bersama. Solusi virtualisasi Anda harus dapat membuat kluster failover sehingga tidak masalah pada host mana yang hidup VM, jika host mati, VM secara otomatis dimigrasi. Ini juga mengurangi manajemen mikro dan berarti bahwa di masa depan, Anda bisa menambahkan server baru sambil menjaga yang lama berjalan, sampai tidak lagi ekonomis untuk melakukannya. Keputusan ini biasanya disebabkan oleh konsumsi daya atau keterbatasan ruang.

Jika Anda ingin bertambah, Anda mungkin ingin bermigrasi dari penyimpanan di server ke SAN. Dengan cara ini, server Anda menjadi node komputasi murni, dan kesehatannya tidak terlalu penting bagi VM.

mzhaase
sumber
Maklum bahwa dengan solusi / jalur umum ini, ada level tertentu yang harus Anda capai agar benar. Anda bisa mendapatkan redundansi di dalam mesin mahal (PSU, disk, pengontrol, GPU, CPU, kartu jaringan) juga, sambil mengurangi kerumitan dalam manajemen (pembaruan perangkat lunak untuk host kedua, orkestrasi kegagalan VM otomatis, pertimbangan lalu lintas jaringan, izin lalu lintas jaringan, izin, pemantauan) sedikit. Namun, sulit untuk mengatakan apa yang lebih baik tanpa angka yang sulit.
user121391
-8

selama Anda tidak memiliki masalah pada jaringan Anda dan pada sistem cadangan Anda, Anda dapat melanjutkan dengan pengaturan ini tetapi untuk masa depan lebih baik untuk memiliki server Profesional menjadi 100% SEHAT.

Shan't Baghdikian
sumber