Setelah boot dingin dari server Debian 6.0.8 (HP ProLiant), ntpd
bermain malapetaka dengan waktu sistem: offset dan jitter sehubungan dengan server waktu referensi biasa dan dapat diandalkan tumbuh tanpa batas. (Perhatikan bahwa server identik kembar tidak memiliki masalah sama sekali.) Setelah banyak upaya gagal untuk memperbaiki masalah di ntpd
sisi saya memutuskan untuk mencoba reboot, dan semuanya berjalan OK.
Untuk menyelidiki masalah saya menemukan perbedaan ini, yang dapat menjelaskan masalah jam saya:
root@n1:~# zgrep Detected /var/log/dmesg*
/var/log/dmesg:[ 0.004000] Detected 2400.110 MHz processor.
/var/log/dmesg.0:[ 0.004000] Detected 2383.579 MHz processor.
/var/log/dmesg.1.gz:[ 0.004000] Detected 2400.036 MHz processor.
/var/log/dmesg.2.gz:[ 0.004000] Detected 2400.298 MHz processor.
/var/log/dmesg.3.gz:[ 0.004000] Detected 2400.165 MHz processor.
/var/log/dmesg.4.gz:[ 0.004000] Detected 2400.410 MHz processor.
Perhatikan bahwa pada boot terakhir kedua (yang bermasalah), freq CPU yang terdeteksi adalah outlier yang jelas. Tanpa outlier, kesalahan dan standar deviasi dari frekuensi yang terdeteksi sehubungan dengan yang nominal adalah +0,15 MHz ± 0,25 MHz. Untuk boot bermasalah saya memiliki kesalahan -16,4 Mhz, yaitu sekitar 100 kali lebih besar dari yang diharapkan.
Pertanyaan saya:
Bisakah kesalahan jenis ini membuat
ntp
disiplin waktu tidak stabil / tidak dapat digunakan? Apakah ini alasan untuk masalah jam saya?Apakah perilaku seperti ini merupakan gejala dari perangkat keras yang jelek? Haruskah server masuk ke pemeliharaan hw?
Memperbarui
Beberapa data bermanfaat:
- kernel 2.6.32-5-amd64 (Debian 2.6.32-48squeeze4)
current_clocksource
adalahtsc
- kesalahan untuk
lpj
(tentu saja) konsisten dengan kesalahan pada freq CPU
Beberapa garis konteks untuk hal di atas grep
[ 0.000000] hpet clockevent registered
[ 0.000000] Fast TSC calibration using PIT
[ 0.004000] Detected 2400.110 MHz processor.
[ 0.000008] Calibrating delay loop (skipped), value calculated using timer frequency.. 4800.22 BogoMIPS (lpj=9600440)
sumber
ntpdc -c loopinfo
jangan pernah memberi saya nilai drift frekuensi. Sekarang setelah reboot semuanya tampak teratur, dengan nilai drift yang stabil ... BTW saran Anda sudah benar, saya memantaulog/loopstats
perilaku abnormal.