Server Yang Bergerak Di Dalam Gedung Yang Sama

61

Inilah skenario saya: Saya seorang pengembang yang mewarisi (tanpa sepengetahuan saya) tiga server yang terletak di kantor saya. Saya juga mewarisi pekerjaan menjadi admin server dengan kurangnya pengetahuan administrasi server dan google / ServerFault sebagai titik referensi. Untungnya, saya tidak pernah benar-benar bersentuhan secara fisik dengan mesin atau mengatasi masalah apa pun karena mereka selalu 'hanya bekerja'.

Ketiga mesin berada di ruang data yang sama dan melayani tujuan berikut:

Machine1- IIS 8.0 hosting sejumlah aplikasi internal
Machine2- Menyimpan data SQL Server 2008 R2 untuk aplikasi internal
Machine3- SQL Server 2008 R2 menyimpanMachine2

Ketiganya memiliki hard drive eksternal yang terhubung yang sering melakukan back up.

Saya telah diberitahu bahwa ketiganya harus berpindah dari satu ruang data ke ruang data yang lain di tempat yang sama. Saya tidak akan menyelesaikan pemindahan fisik perangkat keras, yang akan ditangani oleh penggerak yang kompeten.

Selain menyelesaikan back-up masing-masing, pertimbangan apa yang perlu saya buat sebelum secara hipotetis mematikan saklar daya dan melihat dunia saya bergerak?

Saya sadar bahwa ini jauh dari ideal karena ketiganya terletak di ruangan / tempat yang sama tapi itu melewati ruang lingkup pertanyaan ini.

Gareth
sumber
3
Meskipun tidak terkait dengan langkah ini, Anda sudah memiliki rencana apa yang akan Anda lakukan jika satu (atau semua) motherboard / catu daya / disk mati? (karena itu akhirnya akan terjadi)
Dusan Bajic
5
@spuder mungkin mereka membutuhkan aplikasi yang tersedia tanpa Internet (mereka mengatakan itu adalah aplikasi internal) atau mereka hanya tidak ingin NSA mengintip. Awan bukan peluru perak.
André Borie
27
Ini tidak cukup untuk jawaban itu sendiri, tetapi saya sarankan melakukan soft-down dan power-up sebelum pindah sehingga Anda tahu apa yang dilakukan server ketika mereka berhasil dihidupkan. Mungkin ada beberapa bunyi bip menakutkan atau pesan kesalahan yang tidak dapat Anda abaikan jika Anda belum pernah mengayuh daya server sebelumnya. Ketika Anda tahu apa yang tampak / terdengar seperti power-on yang halus, dan berapa lama, Anda akan berada dalam posisi yang lebih baik untuk menilai apakah ada sesuatu yang sangat salah setelah pindah.
Stefan Mohr
2
Lakukan reboot setiap mesin secara bergantian dan berharap ia hidup kembali tanpa kesalahan sebelum Anda bergerak!
Matt
7
@ Mat setidaknya dia mengakui tidak tahu apa-apa dan mencoba belajar mana yang bagus. Saya telah melihat terlalu banyak kasus di mana admin adalah seorang idiot yang lengkap tetapi bahkan tidak menyadarinya.
André Borie

Jawaban:

61

Pertanyaan yang sangat menarik, ditanyakan dengan baik :)

Ada beberapa hal yang perlu Anda periksa sebelum langkah ini, ada yang mudah, ada yang sulit.

Daya - periksa bahwa ruang baru tidak hanya memiliki jumlah stopkontak yang tepat tetapi juga tipe yang tepat - seperti pada tipe konektor fisik dan jika lokasi saat ini memungkinkan fase daya yang berbeda per server untuk melindungi terhadap kegagalan satu fasa maka saya Saya sangat mendesak Anda untuk meniru itu juga di lokasi baru.

Pendinginan - Anda perlu memeriksa bahwa tidak akan ada penumpukan panas secara langsung atau bertahap yang akan menyebabkan panas berlebih dan potensi server shutdown. Anda biasanya dapat mencari daya maksimum (dalam watt) atau panas (dalam BTU) yang dapat diambil oleh setiap server dari situs web produsen - beri tahu manajer bangunan Anda dan dapatkan konfirmasi tertulis dari mereka yang menyatakan bahwa pendinginan di lokasi tersebut akan mengatasi .

Jaringan - ini yang sulit - tidak hanya jumlah port yang sama perlu direplikasi antara lokasi lama dan baru tetapi juga jenis, kecepatan, dan konfigurasi yang paling penting. Poin terakhir ini adalah kuncinya - ada saat ketika hampir semua port dalam sebuah jaringan hampir sama - saya cukup tua untuk mengingat saat-saat itu! tetapi hari-hari ini jumlah konfigurasi port dan tempat di jaringan di mana satu port bisa menjadi astronomis, Anda perlu memastikan bahwa orang-orang jaringan Anda direplikasi SEMUA yang identik dari yang lama ke yang baru - lagi dapatkan ini secara tertulis karena ini itu tidak mudah. Jika ada yang salah dengan langkah ini saya akan menaruh uang itu akan berada di port jaringan yang tidak identik, itu terjadi sepanjang waktu.

'Koneksi lain' - tahukah Anda jika server Anda memiliki koneksi selain daya dan jaringan? mungkin mereka memiliki tautan Fibre-Channel ke penyimpanan bersama, KVM menghubungkan ke layar manajemen bersama - lagi jika mereka perlu Anda mereplikasi ini secara identik.

Selain itu jangan ragu untuk kembali ke sini dengan pertanyaan yang lebih spesifik, dan saya harap langkah ini berjalan dengan baik.

Chopper3
sumber
2
+1 untuk Chopper3 - Saya juga menambahkan bahwa tergantung pada bagaimana jaringan Anda dikonfigurasi, hanya ada kemungkinan kecil bahwa alamat MAC kartu jaringan Anda tidak akan dirilis dari sakelar lama dan Internet mungkin tidak berfungsi tergantung pada bagaimana jaringan dibangun. Saya tahu ini mungkin tidak terjadi jika sakelar dikonfigurasi dengan benar, namun saya telah bekerja di lingkungan yang besar dan ini cukup sering terjadi dan insinyur jaringan harus menghapus entri MAC secara manual.
Mugurel
4
Ambil foto dari backplane sebelum dibongkar. Menghemat banyak rasa sakit.
Sobrique
1
Segala sesuatu. Ambil saja foto di ponsel kamera Anda dari mana semua kabel pergi, dan apa yang terpasang dan apa yang tidak. (Dengan asumsi Anda diizinkan orang-orang di DC). Sangat bagus untuk mengecek nanti bagaimana 'segala sesuatu tampak' jika sesuatu yang aneh terjadi.
Sobrique
2
Ah jadi 'port' waktu itu - backplane sering merujuk pada sesuatu yang sama sekali berbeda
Chopper3
2
@ Chopper3 Backplane selalu mengacu pada komponen perangkat keras internal dan tidak pernah "bagian belakang casing server." Kecuali ketika itu berarti jaringan sosial gagal.
Christopher Schultz
27

Jawaban lain mencakup aspek teknis dari langkah tersebut. Anda mungkin juga harus mempertimbangkan beberapa hal lain.

Pastikan pengguna tahu bahwa aplikasi mereka akan turun selama beraktivitas. Anda akan ingin menjadwalkan perpindahan, mungkin selama jam tidak bekerja, sehingga Anda meminimalkan jumlah orang yang terpengaruh.

Mintalah orang yang berpengetahuan (atau orang) menguji aplikasi setelah Anda membuka server. Mintalah mereka melakukan beberapa pemeriksaan kewarasan untuk memastikan aplikasi berfungsi seperti yang diharapkan.

Setelah pengujian, beri tahu pengguna Anda bahwa pemindahan selesai dan minta mereka memberi tahu Anda jika mereka memiliki masalah.

chue x
sumber
18

Cukup sulit untuk mengatakan dan membatasi "terlalu luas" untuk format kami. Hal terpenting yang perlu Anda periksa adalah apakah Anda perlu mengkonfigurasi ulang jaringan Anda dengan cara apa pun jika mereka dapat tetap berjalan dengan alamat yang sama. Bahkan jika mereka dapat menyimpan alamat yang sama, pastikan mereka tidak dikonfigurasikan melalui DHCP dan / atau memverifikasi server DHCP akan tersedia di lokasi baru.

Catatan: Seperti yang sudah Anda nyatakan, memiliki server SQL dan mirrornya jauh dari ideal. Namun, memiliki drive cadangan di lokasi yang sama benar - benar berbahaya. Anda harus memiliki cadangan di lokasi fisik yang berbeda.

Sven
sumber
7
+1 cadangan. Mereka tidak boleh berada di lokasi yang sama, juga server yang didukung tidak boleh memiliki akses ke media cadangan, jika tidak kesalahan / malware / sabotase / ransomware di salah satu server dapat menghancurkan cadangan juga. Saat ini mungkin tidak memiliki anggaran, tetapi letakkan di daftar yang harus Anda lakukan.
sdkks
16

Jawaban lain memiliki pertimbangan awal yang baik. Namun, Anda juga harus merencanakan bagaimana Anda mengatur langkah yang sebenarnya. Dari kenyataan bahwa Machine3 adalah cermin dari Machine2 , sepertinya uptime adalah pertimbangan yang signifikan untuk database SQL Server 2008 R2. Fakta bahwa itu adalah cermin memberi Anda peluang. Alasan keberadaan cermin harus tersedia ketika server utama tidak. Itu termasuk tidak tersedia karena pemeliharaan, termasuk pindah.

Buat rencana:
Anda harus membuat rencana tertulis untuk bagaimana langkah itu akan dilakukan. Anda mungkin harus dapat memberikan rencana ini, atau bagian dari itu, kepada orang-orang yang menangani bagian-bagian dari pekerjaan tersebut (mis. Penggerak). Rencana ini harus mencakup semua kegiatan pra-pindah, tindakan aktual, dan tindakan pasca-pindah (mis. Verifikasi fungsi).

Pindahkan Dasar:

  1. Pindahkan Machine3 (cermin SQL Server): Dapatkan sepenuhnya operasional. Verifikasi sinkronisasi ulang.
  2. Pindahkan Machine2 : Dapatkan sepenuhnya operasional.
  3. Pindahkan Machine1 : Dapatkan sepenuhnya operasional.

Penjelasan lebih rinci tentang langkah ini:

Berikut ini mencakup dua metode (Jalur A dan B) menggunakan Machine3 untuk menguji koneksi untuk Machine1 dan / atau Machine2 . Anda hanya harus menggunakan satu metode. Cara apa untuk melakukannya, atau bahkan jika menggunakan salah satunya, tergantung pada informasi yang tidak terkandung dalam pertanyaan (misalnya pemisahan fisik lokasi mesin akhir, ukuran fisik mesin, panjang jaringan / kabel listrik, ketersediaan ekstensi untuk hal yang sama, kesamaan konfigurasi port jaringan, kebutuhan waktu aktif, dll.). Menggunakan Machine3 untuk menguji koneksi ini berpotensi memungkinkan waktu kerja yang lebih tinggi untuk Machine2 , tetapi khususnya untuk Machine1 , yang tidak memiliki mirror. Anda dapat memilih untuk menggunakan salah satu metode, atau tidak sama sekali.

  1. Pindahkan Machine3 terlebih dahulu.

    • Tinggalkan Machine1 dan Machine2 di tempat untuk saat ini.
    • Mesin Pencadangan3 , lalu matikan
    • Dapatkan Machine3 sepenuhnya dipindahkan ke lokasi baru.
    • [Jalur B:. Tidak digunakan jika Anda akan menggunakan opsional langkah # 2] Jika jaringan dan daya konfigurasi untuk semua mesin identik: Masukan machine3 mana machine1 direncanakan berakhir menggunakan koneksi ditujukan untuk machine1 .
    • Dapatkan Machine3 kembali dan berjalan. Di lokasi baru, verifikasi bahwa itu berfungsi secara normal sebagai cermin dari Machine2 . Ini akan memberikan verifikasi fisik bahwa konfigurasi semua masalah (daya, jaringan, dll) berfungsi di lokasi baru.
    • Atasi semua masalah yang muncul.
    • Pastikan bahwa Machine3 telah sepenuhnya disinkronkan dengan Machine2 sebelum melanjutkan.
  2. Jalur A: (Opsional):

    • Gunakan Machine3 untuk menguji semua fasilitas yang dimaksudkan untuk Machine2 dan Machine1 .
    • Matikan Machine3 ke bawah dan pindahkan / alihkan untuk menggunakan posisi / koneksi untuk Machine2 , (verifikasi sinkronisasi ulang) lalu Machine1 (verifikasi sinkronisasi ulang). Jika Anda berencana untuk melakukan ini, maka Machine3 seharusnya sudah diatur dengan koneksi yang dimaksudkan untuk penggunaan akhir oleh Machine1 atau Machine2 , sehingga Anda tidak mengaturnya terlebih dahulu di lokasi akhir untuk Machine3 dan kemudian mengubahnya 3 kali, tetapi hanya 2 dengan memulainya dengan menggunakan fasilitas dari salah satu mesin lainnya.
    • Pastikan bahwa Machine3 telah sepenuhnya disinkronkan dengan Machine2 sebelum melanjutkan.
  3. Pindahkan Mesin2 .

    • Latihan Anda dengan Machine3 harus membuat ini lebih halus.
    • Backup Machine2 , lalu matikan
    • Pindahkan Machine2 ke lokasi baru; buat semua koneksi
    • Atasi semua masalah yang muncul.
    • Pastikan bahwa Machine2 telah sepenuhnya disinkronkan dengan Machine3 sebelum melanjutkan.
  4. [Jalur B: Tidak diperlukan jika Anda diuji semua koneksi dengan machine3 di opsional langkah # 2] Jika sekarang memiliki machine3 mana machine1 adalah untuk berakhir:

    • Matikan Mesin3 .
    • Pindahkan ke tempat yang direncanakan berakhir (keluar dari lokasi yang Anda inginkan untuk berada di Machine1 ).
    • Atasi semua masalah yang muncul.
    • Pastikan bahwa Machine3 telah sepenuhnya disinkronkan dengan Machine2 sebelum melanjutkan.
  5. Pindahkan Machine1 .

    • Setelah pindah Kedua machine2 dan machine3 (dan mudah-mudahan menguji koneksi yang sebenarnya machine1 akan menggunakan dengan memiliki machine3 menggunakannya sementara), ini harus menjadi halus dari bergerak.
    • Mesin Pencadangan1 , lalu matikan
    • Pindahkan Machine1 ke lokasi baru; buat semua koneksi
    • Atasi semua masalah yang muncul.
    • Jika ada yang tidak beres dengan fasilitas di posisi yang seharusnya ditempati Machine1 , Anda memiliki opsi untuk menggunakan fasilitas di mana Machine3 sekarang berada. Semoga Anda sudah dapat menguji semua fasilitas di posisi Machine1 dengan memilikinya sudah digunakan oleh Machine3 untuk sementara waktu (Jalur A atau Jalur B).
Makyen
sumber
7

Jika salah satu IP server akan berubah maka dan koneksi dibuat ke kotak SQL melalui resolusi DNS maka Anda akan perlu menjadwalkan perubahan ke catatan DNS pada saat yang sama dengan perpindahan.

Hal-hal yang harus Anda ketahui tentang perangkat lunak dan basis data intranet:

  • Apakah perangkat lunak intranet terhubung ke SQL Server melalui IP, NetBIOS, atau DNS?
  • Apakah akun pengguna SQL Server yang digunakan oleh perangkat lunak intranet memiliki otentikasi terbatas pada lalu lintas yang berasal dari IP?
  • Apakah karyawan di perusahaan Anda mengakses SQL Server langsung dari spreadsheet atau alat pelaporan, jika demikian, bagaimana mereka mendefinisikan DSN?

Jika Anda tidak mendapatkan IP yang sama persis, atau jika Anda berakhir di subnet yang berbeda, Anda akan memerlukan akses untuk mengubah kode sumber atau file konfigurasi untuk aplikasi apa pun yang terhubung ke server SQL. Orang-orang dapat mengandalkan akses SQL tanpa dokumen dan langsung untuk pelaporan ad-hoc.

chugadie
sumber
2

Gunakan server "Disaster Recovery" Anda. Beralihlah ke mereka untuk menangani beban saat Anda memindahkan server produksi Anda. Dengan peralatan DR yang dikonfigurasi dengan benar, Anda dapat melakukan gerakan di tengah hari tanpa melihat banyak waktu henti (hingga 15 menit). Karena server pemulihan bencana harus dikonfigurasi dengan cara yang sama seperti server produksi. Jika Anda tidak memiliki peralatan DR, saya sangat merekomendasikan untuk mendapatkannya.

Pikirkan seperti ini: ketika korvet Anda siap, gunakan minivan Anda untuk melewati hari.

Software_Programineer
sumber
6
Anda berasumsi banyak tentang perusahaan yang mengejutkan admin yang tidak berpengalaman dengan tiga server.
RoadieRich
Tentu saja, saya mengasumsikan lab server pengaturan berfungsi dengan benar. Atau setidaknya tempat yang memiliki beberapa server lama (atau bahkan PC) masih tergeletak mengumpulkan debu. Konfigurasi ulang mereka hanya untuk bergerak.
Software_Programineer
1

Satu hal yang saya pikir tidak disebutkan adalah keamanan fisik dari rumah baru dari server. Untuk apa ruangan itu sebelumnya dan siapa yang memiliki kunci? Apakah ada keamanan yang memadai (sistem alarm, kamera, dll.).

caletron
sumber
1

Beberapa pertimbangan selain jawaban lain:

  • Apakah aplikasi terkait dengan yang lain dengan misalnya pertukaran data setiap malam dengan file atau dengan menggunakan layanan web? Apa konsekuensi ketika aplikasi tidak tersedia? Dapatkah aplikasi terkait mengatasi hal ini atau apakah mereka gagal atau bahkan menghasilkan hasil yang salah karena kurangnya informasi dari aplikasi Anda?

  • Apakah downtime dapat diterima untuk pengguna, perusahaan, atau bahkan klien Anda? Berapa lama mungkin?

  • Saya pikir itu ide bagus untuk memiliki rencana untuk rollback. Anda dapat menggunakannya jika ada masalah yang tidak dapat diselesaikan dengan cepat, misalnya masalah jaringan. Anda mungkin perlu menjaga penggerak tersedia untuk kasus membawa perangkat keras kembali.

  • Apakah aplikasi Anda mengarah ke lalu lintas jaringan yang tinggi dan apakah jaringan harus siap untuk ini (mungkin jauh lebih kecil masalah daripada masalah dengan alamat dan firewall)? Jika Anda memiliki aplikasi waktu nyata (mis. Perangkat lunak konferensi video) latensi akan menjadi penting.

  • Server harus masuk ke rak server jika Anda memilikinya.

mm759
sumber