Apa strategi untuk mendeteksi pergeseran waktu di pusat data berbasis linux?

14

Apa strategi untuk mendeteksi pergeseran waktu di semua pusat data berbasis linux? Ini adalah masalah yang lebih sulit daripada yang terlihat pada awalnya.

Waktu melayang dapat menyebabkan masalah serius untuk aplikasi tertentu dan seringkali, meskipun NTP diinstal, mungkin gagal karena alasan berikut (dan banyak lagi):

  • NTP tidak diatur dengan benar untuk secara otomatis restart saat reboot.
  • Pengaturan pada server tidak benar sehingga server waktu yang ditunjuknya tidak dapat dijangkau atau tidak akurat.
  • Server waktu master tidak dapat dijangkau dan semua server sedang menyinkronkan dengan itu sekarang menyinkronkan ke sumber yang tidak dapat diandalkan.

Saya ingin cara untuk mendeteksi jika semua server individu sudah benar. Ingatlah bahwa server dengan skrip / aplikasi pengujian mungkin tidak benar.

Stuart Woodward
sumber
6
Saya pikir alasan Anda palsu, NTP operasional sangat penting untuk pertanian. Pastikan NTP berfungsi dengan baik. Juga, gunakan jam master lokal.
user539484
NTP bekerja di luar kotak pada banyak distro Linux sekarang dengan default yang masuk akal. Ini bukan masalah sekarang.
Mat

Jawaban:

20

Ini mudah dikendalikan. Manajemen konfigurasi adalah kuncinya ...

Pastikan bahwa layanan ntp berjalan dan terkonfigurasi ...

Sebagai contoh, menggunakan Monit untuk memastikan ntpdberjalan dan untuk me-restart jika gagal adalah pendekatan yang mudah ... Mungkin masuk akal untuk menambahkan cron dan daemon penting lainnya untuk pemeriksaan semacam itu.

Pilihan lain adalah menggunakan alat manajemen konfigurasi seperti Puppet untuk memaksa ntpd.conf yang sama ke server Anda dan memastikan bahwa ntpd diinstal, dikonfigurasi dan dijalankan.

Ada cukup banyak redundansi dalam protokol NTP untuk menangani instance server waktu yang tidak dapat dijangkau. Tentukan beberapa sumber.

putih
sumber
3
Saya harus mengulangi sentimen ini. Manajemen konfigurasi dan beberapa server NTP adalah bagian infrastruktur yang cukup mendasar dalam hal apa pun yang mendekati "pusat data". Pusat data menengah atau lebih besar harus memiliki jam perangkat keras. Sumber waktu GPS dapat dibeli seharga beberapa ratus, dan jika Anda memiliki setrika solder <$ 100.
Chris S
solusi ini + nagios
pria itu dari sana
4
Perhatikan bahwa cara Anda memeriksa ntpdstatus cukup penting. Anda tidak ingin hanya mengatakan "ntpd sedang berjalan. Semuanya hebat!". Anda harus benar-benar memverifikasi bahwa sistem Anda menyinkronkan dan memiliki rekan fungsional, atau bahwa waktu offset minimal antara host dan kotak pemantauan . Nagios memiliki check_ntp_peerdan check_ntp_timeyang menangani itu, jika Anda ingin menggunakan Nagios.
voretaq7
ntpq untuk memeriksa status
kubanczyk
10

Ada berbagai plugin check_ntp untuk nagios di luar sana.

Ini dia:

http://nagiosplugins.org/man/check_ntp

Tambahkan cek ini ke host nagios Anda dan dapatkan peringatan jika ada yang salah.

dmourati
sumber
Yup, cukup atur sistem pemantauan Anda untuk memeriksa apakah waktunya valid, atau setidaknya offset relatif terhadap sistem pemantauan minimal.
Zoredache