Kapan waktu yang tepat untuk memperkenalkan ketersediaan tinggi untuk situs web?
Ada banyak artikel tentang opsi Ketersediaan Tinggi. Tidak begitu jelas namun KAPAN waktu yang tepat untuk beralih dari satu server ke konfigurasi ketersediaan tinggi.
Silakan pertimbangkan situasi saya:
http://www.postjobfree.com adalah situs web 24/7 dengan lalu lintas yang signifikan:
http://www.similarweb.com/website/postjobfree.com
Saat ini saya menjalankannya di satu server: baik server web IIS 7.0 dan SQL Server 2008 dijalankan pada kotak perangkat keras yang sama.
Ada sesekali (~ satu per bulan) ~ 5 menit downtime biasanya disebabkan oleh reboot yang diperlukan oleh beberapa pembaruan Windows Server. Biasanya downtime dijadwalkan dan terjadi pada malam hari. Tetap saja tidak menyenangkan, karena Google Bot dan beberapa pengguna masih aktif di malam hari.
Pendapatan situs web saat ini adalah ~ $ 8K / bulan.
Saya mempertimbangkan untuk beralih ke konfigurasi dua server (web farm dari 2 server web dan sekelompok 2 SQL Server yang dihosting pada dua server perangkat keras).
Kelebihan:
1) Ketersediaan Tinggi (secara teoritis tidak ada downtime). Bahkan jika salah satu server turun - server lain akan mengambil alih.
2) Tidak ada kehilangan data: tanpa SQL cluster, hingga satu hari data dapat hilang jika terjadi kegagalan perangkat keras (kami membuat cadangan harian).
Cons:
1) Lebih banyak upaya untuk mengatur dan memelihara konfigurasi tersebut.
2) Biaya hosting lebih tinggi. Alih-alih ~ $ 600 / bulan itu akan menjadi sekitar $ 1200 / bulan.
Apa yang akan menjadi rekomendasi Anda?
sumber
Jawaban:
Jawaban singkat: Ketika waktu henti atau risiko biayanya lebih banyak daripada biaya untuk memiliki ketersediaan tinggi.
Ini secara fundamental merupakan keputusan ekonomi. Sebagai contoh. $ 8k / bulan menyiratkan bahwa pemadaman 2 jam akan dikenakan biaya $ 22. Jika Anda dapat mengkonfigurasi sistem Anda sedemikian rupa sehingga Anda dapat beralih dari awal ke situs yang berfungsi penuh dalam 2 jam, maka ketersediaan tinggi hanya akan memberi Anda $ 22 fungsionalitas di atas itu.
Dengan kata lain, Anda dapat menghemat uang kecuali / sampai Anda memiliki 54 jam down-down yang tidak dapat dicegah dalam bulan tertentu.
sumber
Stakeholder / kaum bisnis Anda (yang mungkin Anda!) Harus memutuskan
Kehilangan pendapatan mudah untuk diukur: sisanya tidak dapat dijawab di sini, maaf ...
sumber
Saya pikir sebagian besar pengguna dapat menangani sedikit downtime yang dijadwalkan. Pertimbangkan bahwa ebay memiliki pembaruan mingguan pada malam Jumat, dan tawaran sekitar terkadang tidak berfungsi. Perbankan online bank saya (australia) telah menjadwalkan pemadaman berjam-jam setiap minggu. Twitter menjadi offline setiap saat. Heroku / EC2 turun selama beberapa hari baru-baru ini.
Saya akan tetap dalam perspektif itu, jika Anda benar-benar hanya berbicara 5 menit sebulan, Anda melakukan pekerjaan yang cukup baik sebagai sysadmin.
sumber
Anda telah menyebutkan Google sebagai faktor dalam pengindeksan, tetapi mungkin juga layak mempertimbangkan dampak bahwa latensi / respons situs mungkin terhadap SEO. Ini kotak hitam dan sebagainya, sangat sulit untuk diukur - meskipun untuk apa nilainya, Matt Cutts menganggap itu adalah satu-persen . Saya akan lebih peduli tentang reputasi, seperti yang orang lain katakan.
sumber
Perlu diingat bahwa HA, seperti keamanan, bukan produk, melainkan sebuah proses.
Misalnya, replikasi basis data hanya akan membawa Anda ke titik di mana setiap mirror dari basis data akan dapat melanjutkan sendiri, tetapi Anda juga akan memerlukan strategi untuk sinkronisasi ulang setelah komponen yang gagal diganti.
Pertimbangkan sistem pemesanan sebagai contoh: pelanggan mengirimkan pesanan, dan selama pemrosesan, sistem fisik yang ia ajak bicara gagal setelah menyimpan informasi pesanan dalam salinan lokal dari basis data. Dengan tidak sabar, pelanggan menekan "kirim" lagi, dan diarahkan ke server lain, yang menerima pesanan. Jika database Anda disinkronkan ulang dengan hanya memutar ulang pernyataan INSERT yang hilang di sisi lain, maka pesanan akan digandakan, yang mungkin bukan yang Anda inginkan.
Seperti yang disarankan @Slartibartfast, itu semua bermuara pada keputusan ekonomi, namun saya sarankan Anda juga merencanakan beberapa tahun di masa depan di sini. Jika Anda berharap membutuhkan pengaturan HA yang tepat, maka sekarang adalah saat yang tepat untuk menyisihkan sumber daya untuk pekerjaan persiapan.
sumber
Sementara Anda memikirkan hal ini, saya pikir Anda mempertimbangkan untuk membuat halaman "paus gagal".
Ada banyak cara untuk melakukan ini tetapi kombinasi rute53 dan s3 bekerja dengan baik di situs kecil saya.
Saya mengatur domain dengan pemeriksaan kesehatan sehingga pada kegagalan DNS mengirim pengguna ke pengguna ke halaman html statis di s3; Biaya hampir tidak ada.
Dalam pengalaman saya memiliki situs Anda mengatakan "maaf ada yang rusak tetapi kami sedang mengusahakannya" membuat perbedaan bagi pengguna. Akun Twitter tempat Anda dapat berkomunikasi dengan pengguna bahkan lebih baik.
Ini perlu waktu lama untuk mengurangi "kehilangan reputasi" yang bisa menjadi dampak paling signifikan dari pemadaman.
lihat: https://aws.amazon.com/blogs/aws/create-a-backup-website-using-route-53-dns-failover-and-s3-website-hosting/ untuk panduan tentang pengaturannya.
Kegagalan sosial DynDns http://dyn.com/managed-dns/social-failover/ adalah sejenis hal yang serupa.
Anda dapat memutar sendiri dan melakukan pemeriksaan kesehatan, lalu skrip perubahan DNS, asalkan catatan DNS Anda memiliki TTL rendah dan Anda memiliki beberapa cara untuk memanipulasinya secara terprogram.
sumber
Sudahkah Anda mempertimbangkan untuk menggunakan sesuatu seperti EC2 yang akan membuat Anda skala secara fleksibel dan juga meniadakan kontra Anda? Ini pada akhirnya merupakan keputusan ekonomi apakah menggunakan EC2 layak atau tidak, tetapi paling tidak, opsi untuk dipertimbangkan.
sumber
Untuk menghindari kehilangan data, Anda harus melihat konfigurasi Raid sebelum cluster. Anda juga harus mengkonfigurasi IP Failover yang dapat Anda alihkan dari satu server ke server lain jika terjadi bencana tanpa harus menunggu propagasi DNS.
sumber