Mengoreksi untuk keputusan jam didistribusikan secara normal

10

Saya memiliki percobaan yang dijalankan pada ratusan komputer yang didistribusikan di seluruh dunia yang mengukur kejadian peristiwa tertentu. Peristiwa masing-masing bergantung satu sama lain sehingga saya dapat memesannya dalam urutan yang meningkat dan kemudian menghitung perbedaan waktu.

Peristiwa harus didistribusikan secara eksponensial tetapi ketika merencanakan histogram inilah yang saya dapatkan:

Histogram acara

Ketidaktepatan jam di komputer menyebabkan beberapa acara diberi stempel waktu lebih awal dari pada saat mereka bergantung.

Saya bertanya-tanya apakah sinkronisasi jam dapat disalahkan karena fakta bahwa puncak PDF tidak pada 0 (bahwa mereka menggeser semuanya ke kanan)?

Jika perbedaan jam terdistribusi secara normal, dapatkah saya berasumsi bahwa efeknya akan saling menggantikan dan karenanya hanya menggunakan perbedaan waktu yang dihitung?

cdecker
sumber

Jawaban:

13

Masalah sinkronisasi jam memang dapat menyebabkan puncak bergeser ke kanan. Simulasi berikut dalam R menunjukkan fenomena ini. Saya menggunakan waktu eksponensial dan perbedaan jam normal untuk mendapatkan bentuk yang kira - kira menyerupai gambar Anda:

Jam

Distribusi ke kiri (perbedaan aktual, diukur tanpa kesalahan) memiliki puncaknya pada 0, sedangkan distribusi ke kanan (perbedaan diukur dengan kesalahan) memiliki puncaknya sekitar 100.

Kode-R:

set.seed(20120904)

# Generate exponential time differences:
x<-rexp(100000,1/900)

# Generate normal clock differences:
y<-rnorm(100000,0,50)

# Resulting observations:
xy<-x+y

# Truncate at 500:
xy<-xy[xy<=500]

# Plot histograms:
par(mfrow=c(1,2))
hist(x[x<=500],breaks=100,col="blue",main="Actual differences")
hist(xy,breaks=100,col="blue",main="Observed differences")
lines(c(0,0),c(0,550),col="red")

Jika perbedaan jam normal dengan rata-rata 0 perbedaan harus membatalkan dalam arti bahwa rata-rata perbedaan yang diamati harus sama dengan perbedaan aktual. Apakah ini kasusnya tergantung pada apakah ada perbedaan sistematis antara komputer tempat peristiwa pertama terjadi dan komputer tempat peristiwa kedua terjadi.

MånsT
sumber
4
+1 Diilustrasikan dengan baik. Secara matematis, data diambil dari jumlah distribusi kesalahan dan distribusi (diperkirakan) eksponensial. Sangat menggoda untuk memperkirakan distribusi kesalahan dan mendekonvolusi data untuk memperkirakan distribusi yang sebenarnya.
Whuber