Dari orang-orang yang mengelola kelompok mereka sendiri (yaitu tidak menggunakan / membayar untuk Amazon Autoscale, Rightscale, Scalr, dll.), Bagaimana Anda mengelola mesin virtual Anda pada EC2 dan menangani (misalnya) failover? Saya bertanya-tanya apakah kebanyakan orang akhirnya menulis skrip kapal mereka sendiri melawan EC2 API, seperti yang saya duga.
Itu tentu saja pendekatan kami: menyiapkan daemon pemantauan / memulai ulang Python Boto kami sendiri yang berjalan di luar situs, mendengarkan UDP keep-alive dari instance kami. Jika gagal, kami memotret volume, mendaftarkan gambar, memulai instance baru, menghapus volume lama, dan sebagainya.
Sering kali, ketika meretas skrip kami, saya pikir pasti ada beberapa alat open-source di luar sana yang sudah menangani masalah ini, dan yang tidak memiliki kendala (katakanlah) Scalr, tapi saya selalu kembali dari Google dengan tangan kosong (Hal-hal seperti yang dimiliki Scalr sangat terbatas pada set / versi / konfigurasi perangkat lunak yang didukung, dan memiliki cara rumit dan rumit IMO untuk memanipulasi pengaturan ini.)
Juga, ekosistem Linux-HA / Alat Pacu Jantung (Detak Jantung, ldirectord, dll.) Sepertinya tidak cocok untuk EC2 . (Tapi kemudian saya menemukan ini - walaupun saya tidak yakin ini benar-benar solusi berkualitas tinggi).
RightScale memiliki beberapa artikel hebat tentang cara mengotomatisasi failover pada EC2. Sementara sebagian besar dari mereka menunjukkan kepada Anda bagaimana melakukannya menggunakan RightScale itu sendiri, prinsip-prinsipnya bersifat umum dan mungkin membantu siapa pun yang berpikir tentang cara mengatur arsitektur failover pada EC2.
sumber
Masalah yang Anda uraikan (HA, pemantauan server khusus, layanan 'duct-taping') umumnya ditangani oleh penyedia PaaS. Rightscale dan Scalr telah disebutkan dalam jawaban sebelumnya dan ada opsi bagus tambahan (lihat di sini untuk beberapa opsi PaaS:
/programming/9542784/looking-for-paas-providers-recomendations )
Anda harus mempertimbangkan penyedia mana yang paling sesuai dengan kebutuhan Anda.
Pemberitahuan jatuh tempo: Saya bekerja untuk cloudify, penyedia PaaS sumber terbuka.
sumber
Baru-baru ini saya menulis posting di blog teknik kami tentang cara menggunakan ELB bersama dengan Penskalaan Otomatis untuk mencapai failover otomatis untuk semua jenis aplikasi. Ini mencakup bagaimana pemeriksaan kesehatan ELB dapat digunakan untuk melakukan ping ke status aplikasi Anda dan memicu tindakan penskalaan otomatis.
sumber
Anda memasang detak jantung pada kedua server Anda melampirkan IP elastis ke server 'aktif' Anda mengkonfigurasi skrip untuk melakukan failover dengan memulai permintaan API untuk mendapatkan IP elastis Segera setelah server 'siaga' mendapatkan IP elastis ( memakan waktu sekitar 30-60 detik) bisa jadi master / aktif.
Saya tidak memiliki spesifikasi untuk diberikan di sini.
sumber
Amazon sudah menyediakan Elastic Load Balancing ... Mengapa menemukan kembali kemudi?
sumber