Hal-hal Utama yang harus dicari di Pusat Data

34

Saya mencoba membuat daftar periksa sederhana untuk menentukan kualitas pusat data ... di mana dan apa yang harus saya cari dan bagaimana saya bisa menentukan jika apa yang dikatakan pemilik (mis. "UPS kami menjaga pusat data tetap tinggi selama 100 hari tanpa kekuatan ") benar atau tidak? Apa tanda-tanda khas atau pusat data yang baik atau buruk?

AX1
sumber

Jawaban:

43

Berikut adalah daftar pertanyaan yang saya buat untuk diri saya sendiri terakhir kali saya berbelanja di pusat data:

  • Jelaskan apa yang diperlukan alat penyiram untuk mematikan peralatan kami.
  • Apa yang akan dilakukan tangan jauh? Misalnya, instal hard drive, putar kaset ...
  • Apakah tangan jarak jauh Anda tersedia 24/7/365, waktu tunggu rata-rata bagi mereka untuk sampai ke kandang setelah mengajukan tiket (Bagaimana tiket dimasukkan?)?
  • Apakah Anda menggunakan banyak kisi?
  • Apakah Anda telah menaikkan pendinginan lantai?
  • Berapa pusat data yang Anda operasikan selain yang ini?
  • Berapa lama datacenter dapat berjalan dengan daya cadangan?
  • Bisakah kita memiliki peralatan yang dikirim langsung ke pusat data?
  • Apakah ada dok pengiriman dan parkir gratis, dekat, dan tersedia?
  • Jika kita memiliki vendor yang datang ke pusat data, apakah kita perlu menemani mereka?
  • Berapa suhu dan kelembaban lingkungan dipertahankan?
  • Ada berapa pilihan ISP?
  • Apakah ada pelanggan Anda yang pernah kehilangan daya untuk sejumlah waktu dalam sejarah pusat data?
  • Berapa lama pusat data ini beroperasi?
  • Kontrol akses apa yang tersedia untuk lantai dan peralatan?

Jika Anda mengunjungi beberapa dan mengajukan pertanyaan ini di antara harga, tayangan kunjungan Anda, dan jawaban mereka, mungkin akan jelas yang mana yang Anda inginkan. Pastikan Anda selalu mengunjungi mereka dan mengunjungi jumlah yang baik.

Kyle Brandt
sumber
2
Sudah selesai dilakukan dengan baik. Memberi +1 kepada Anda.
gWaldo
3
Saya juga akan bertanya tentang kontrol akses ke lantai dan peralatan Anda.
Scott Pack
Daftar hebat !! Saya akan menambahkan: "Apakah Anda memiliki bangunan itu?" Juga, jika mereka memiliki alat penyiram, berjalanlah!
JakeRobinson
@JakeRobinson Penyiram diperlukan oleh kode api , bahkan di pusat data, di banyak tempat. Ketika Anda melihat alat penyiram bertanya apakah mereka alat penyiram pipa kering .
sysadmin1138
3
@JakeRobinson DC baru yang saya gunakan pada tahun 2003 memiliki FM200 dan sprinkler. Petugas pemadam kebakaran sangat tegas bahwa ada HARUS menjadi alat penyiram di sana. Jika FM200 dapat memadamkan api, bagus. Tetapi jika tidak (UPS pecah menembus air-bend FM200 sehingga O2 bisa masuk setelah pembuangan) banyak air akan menyelamatkan gedung. Sistem pipa kering yang tepat berarti bahwa jika kepala sprinkler terbentur, DC tidak akan banjir.
sysadmin1138
6

Kyle menutupinya dengan cukup baik, tetapi berikut adalah beberapa poin:

Keamanan Fisik sangat besar. Hampir harus mengambil tindakan Kongres (Parlemen, masukkan lembaga birokrasi yang bergerak lambat di sini) untuk masuk.

Itu harus memiliki pencegah api Halon, bukan penyiram; Server tidak boleh lembab. (Peraturan penanggulangan kebakaran lokal mungkin mengesampingkan ...)

Cari tahu apa vendor server pilihan mereka. Kecuali itu karena alasan yang sangat spesifik (seperti menjalankan pusat data Google-like), itu harus server nama-merek. (Dell, HP, IBM, Sun, Apple, dll.) Jika mereka mengatakan "kotak putih" atau merek yang tidak Anda kenal, jalankan. Perhatikan bahwa ada beberapa vendor server tingkat rendah yang memiliki reputasi baik (System76, misalnya), tetapi "custom-built" berarti bahwa mereka menyusun semuanya sendiri. Bagus untuk rumah Anda, tetapi buruk untuk pusat data Anda. (Ini tidak termasuk membeli HP Proliant DL580 dan menginstal hal-hal seperti kit opsi memori atau sangkar drive.)

Opsi kepemilikan apa yang tersedia? Beli melalui mereka? Beli langsung dan kirim ke sana? Menyewa? VMS?

gWaldo
sumber
4
Setuju pada pemadaman kebakaran, meskipun untuk "Halon" bacalah "halon / FM200 / Argonite / Inergen / gas pemadam lainnya di sini"
MadHatter mendukung Monica
11
Penyiram sebenarnya dibutuhkan oleh kode api di banyak tempat. Saya menemukan bahwa pada tahun 2003 selama membangun DC saya dibantu dengan. Seharusnya hanya menyala jika FM200 tidak memadamkan sumber panas. Ini harus menjadi sistem sprinkler pipa kering yang mendukung gas inert.
sysadmin1138
2

Sangat baik seperti biasa Kyle, Beberapa hal yang saya pelajari dari pengalaman:

  • Tanyakan apakah ada generator untuk mencadangkan UPS, jika sudah ada generator yang diuji, seberapa sering?

  • Apa kunci dan pemeriksaan fisik yang mereka miliki untuk mencegah listrik membunuh daya?

  • Apa pertanggungan / pertanggungan asuransi yang mereka miliki?

  • Bagaimana mereka menghadapi situasi ketika mereka tidak memenuhi SLA mereka?

  • Seberapa sering mereka belum bertemu SLA?

  • Berapa banyak daya yang mereka berikan untuk setiap rak / kandang / dll? (Apakah Anda akan dibatasi kekuatan dan membutuhkan rak / kandang lain hanya untuk kekuatan ekstra?)

  • Mintalah Referensi, di industri Anda akan baik.

Cerita lucu yang tidak lucu saat itu:

  1. Ada kebakaran di Vancouver di kompartemen listrik bawah tanah, 4 blok dari DC saya, api mengeluarkan daya untuk radius 10 blok. UPS menyalakan lampu sampai Gen-set online. Gen-set tetap online selama sekitar satu jam sebelum pemanasan berlebihan. UPS dapat menyalakan lampu selama 30 menit setelah gen-set mematikan. Gen-set milik gedung, IIRC DC mampu menyalahkan mereka dan mencuci tangan mereka.

  2. Seorang tukang listrik menewaskan beberapa pasangan rak di DC karena panel itu jatuh dan membuat semua pemutus terbuka. Saya juga pernah mendengar tentang seorang tukang listrik di DC lain yang akan bekerja dengan UPS, tidak memasukkannya ke mode bypass dan mencatat seluruh DC.

Clint
sumber
Apakah disarankan untuk memiliki rak UPS untuk kasus-kasus itu atau tidak masalah karena koneksi biasanya dihancurkan dengan segala cara?
AX1
Pasti menyenangkan ... DC kami mengatakan kami tidak diizinkan memiliki UPS di rak kami, mereka memberi kami alasan, tapi saya tidak ingat apa itu.
Clint
Mungkin panas? Saya tidak punya banyak pengalaman dengan UPS rak, tetapi konsumen UPS selalu memanas.
AX1
4
@ AX1: UPS dalam kekacauan rantai daisy satu sama lain. Mereka mengharapkan karakteristik tertentu dalam arus, dan UPS lainnya dapat menyaring mereka. Jaringan mungkin akan turun begitu DC kehilangan daya, jadi meskipun server Anda naik, jaringan tidak akan menyala.
quinnr
Bisa jadi kode kebakaran, jika EPO dipukul petugas pemadam kebakaran berharap tidak ada kekuatan hidup.
Sean Reifschneider
1
  • Saya akan mengatakan bahwa mungkin sepertiga dari pusat data adalah item teknis (Apakah Anda memiliki {VESDA, kontrak pengisian ulang bahan bakar, pendingin yang tercakup oleh UPS, beberapa jaringan listrik, beragam pintu masuk serat).

  • Sepertiga lainnya adalah bagaimana mereka menghadapinya ketika segalanya tidak berjalan dengan baik. Apakah mereka menelan harga diri mereka, memeriksa kegagalan dan mencari tahu apa yang harus dilakukan untuk memastikan itu tidak terjadi lagi? Atau apakah mereka terus melakukan apa yang tidak berhasil sebelumnya?

  • Dan sepertiga lainnya adalah personil. Apakah mereka cerdas, mudah diajak bekerja sama, dan tidak membalik setiap bulan?

Tetapi yang lebih penting: Apakah mereka memiliki ruang yang Anda butuhkan? Satu tempat yang hampir kami kunjungi, dalam waktu 2 tahun kami menggunakan lebih banyak ruang daripada yang tersedia.

Sean Reifschneider
sumber
1

Saya bekerja di pusat data kecil di Lembah Silikon. Saya sysadmin di sisi server yang dikelola dari bisnis.

Tanda-tanda buruk:

  • Kurangnya pemantauan yang berlebihan dan peringatan untuk daya, suhu, kelembaban
  • Kurangnya pemantauan untuk perangkat jaringan, colo, server dan peralatan lainnya
  • Berantakan dan tidak menggunakan ikatan kabel atau manajemen kabel lainnya untuk menjaga rak tetap bersih dan teratur

Tanda-tanda bagus: - Generator diesel di lokasi dengan failover otomatis - Pendingin cadangan dan penangan udara dengan failover otomatis - Banyak bandwidth pada tulang punggung operator utama (AT&T, XO Comm) - Penyedia jaringan yang berlebihan - Router inti yang berlebihan, firewall, penyeimbang beban dan sakelar - Menjalankan pemeriksaan memori dan diagnostik perangkat keras sebelum menggunakan server

Server nama merek baik-baik saja, tetapi jika sudah lama dan sudah ada beberapa kali, Anda sebaiknya memastikan mereka melewati diagnostik perangkat keras sebelum menggunakannya.

Pusat data yang baik harus menyediakan situs web bagi pelanggannya untuk memantau konsumsi bandwidth dan waktu aktif mereka. Mereka juga harus menjawab pertanyaan apa pun. Tanyakan kepada mereka model dan model UPS mereka. Minta mereka untuk melihat muatan saat ini pada UPS. Dengan informasi ini Anda dapat memverifikasi berapa lama bisa tanpa daya.

Tapi jujur, UPS seharusnya tidak menjadi perhatian Anda. UPS hanya menyediakan waktu singkat (sekitar 30 menit). Kekhawatiran yang jauh lebih baik adalah jika DC memiliki generator cadangan. Juga bermanfaat untuk bertanya di grid mana DC menyala. Dalam hal pemadaman dan pemadaman, prioritas yang berbeda ditugaskan untuk jaringan yang berbeda. Tebak apa? Rumah sakit dan stasiun pemadam kebakaran adalah prioritas utama (listrik tidak pernah terputus). Jika Pusat Data berada di grid yang sama, kekuatannya dijamin andal.

Tanyakan kepada mereka berapa daya yang tersedia per rak. Di mana saya bekerja, kami menyediakan setiap rak dengan sirkuit 3x 25amp. Server 1u khas mengkonsumsi 1-3 amp.

80kunci
sumber
Yang saya tergoda untuk pergi memiliki 40amp per rak. Apakah itu terlalu rendah? Hampir setengah dari apa yang Anda katakan (75amp).
AX1
1
@ AX1, 40A pada 110V adalah 4400W; pada 230V itu 9200W. Kecuali itu kepadatan tinggi (Twin / Twin ^ 2 / Blade) atau HPC / GPU, itu BANYAK.
Mircea Chirea