Memeriksa apakah dua sampel Poisson memiliki rata-rata yang sama

30

Ini adalah pertanyaan mendasar, tetapi saya tidak dapat menemukan jawabannya. Saya memiliki dua pengukuran: peristiwa n1 dalam waktu t1 dan peristiwa n2 dalam waktu t2, keduanya diproduksi (katakanlah) oleh proses Poisson dengan nilai lambda yang mungkin berbeda.

Ini sebenarnya dari artikel berita, yang pada dasarnya mengklaim bahwa sejak n1/t1n2/t2 keduanya berbeda, tetapi saya tidak yakin bahwa klaim tersebut valid. Misalkan periode waktu tidak dipilih secara jahat (untuk memaksimalkan peristiwa dalam satu atau yang lain).

Bisakah saya melakukan uji- t , atau apakah itu tidak sesuai? Jumlah acara terlalu kecil bagi saya untuk memanggil distribusi dengan nyaman kira-kira normal.

Charles
sumber
1
Spesimen bagus jurnalisme sains, di sana ...
Matt Parker
1
Ya ... Anda bisa melihat mengapa saya ingin memeriksa statistik yang digunakan.
Charles

Jawaban:

25

Untuk menguji mean Poisson, metode kondisional diusulkan oleh Przyborowski dan Wilenski (1940). Distribusi bersyarat dari X1 yang diberikan X1 + X2 mengikuti distribusi binomial yang probabilitas keberhasilannya merupakan fungsi dari rasio dua lambda. Oleh karena itu, pengujian hipotesis dan prosedur estimasi interval dapat dengan mudah dikembangkan dari metode yang tepat untuk membuat kesimpulan tentang probabilitas keberhasilan binomial. Biasanya ada dua metode yang dipertimbangkan untuk tujuan ini,

  1. Uji-C
  2. E-test

Anda dapat menemukan detail tentang dua tes ini dalam makalah ini. Tes yang lebih kuat untuk membandingkan dua cara Poisson

Wazir
sumber
4
O(n1n2)
1
Penulis makalah E-test menulis implementasi fortran sederhana untuk menghitung nilai-p untuk dua poisson artinya di sini: ucs.louisiana.edu/~kxk4695 Saya portingkan fortran mereka ke MATLAB di sini git.io/vNP86
AndyL
11

Bagaimana tentang:

poisson.test(c(n1, n2), c(t1, t2), alternative = c("two.sided"))

Ini adalah tes yang membandingkan tingkat Poisson 1 dan 2 satu sama lain, dan memberikan nilai ap dan interval kepercayaan 95%.

Rob van Gemert
sumber
Perlu dicatat bahwa untuk masalah dua sampel, ini menggunakan uji binomial untuk membandingkan tingkat
Jon
10

Anda sedang mencari pemeriksaan cepat dan mudah.

λt=t1+t2[0,t1]n1[t1,t1+t2]n2

λ^=n1+n2t1+t2

nsayatsayaλ^nsaya

whuber
sumber
1
Terima kasih (+1), itu hanya pemeriksaan yang tepat untuk hal seperti ini. Itu akhirnya menjadi sangat signifikan (p = 0,005) sehingga artikelnya baik-baik saja. Saya harap Anda tidak keberatan, bahwa saya menerima jawaban yang lain - ada baiknya mengetahui cara 'nyata' untuk melakukannya ketika itu penting.
Charles
5

Saya akan lebih tertarik pada interval kepercayaan daripada nilai ap, di sini adalah perkiraan bootstrap.

Menghitung panjang interval pertama, dan cek:

Lrec = as.numeric(as.Date("2010-07-01") - as.Date("2007-12-02")) # Length of recession
Lnrec = as.numeric(as.Date("2007-12-01") - as.Date("2001-12-01")) # L of non rec period
(43/Lrec)/(50/Lnrec)

[1] 2.000276

Pemeriksaan ini memberikan hasil yang sedikit berbeda (peningkatan 100,03%) dari yang dipublikasikan (peningkatan 101%). Lanjutkan dengan bootstrap (lakukan dua kali):

N = 100000
k=(rpois(N, 43)/Lrec)/(rpois(N, 50)/Lnrec)
c(quantile(k, c(0.025, .25, .5, .75, .975)), mean=mean(k), sd=sd(k))

     2.5%       25%       50%       75%     97.5%      mean        sd 
1.3130094 1.7338545 1.9994599 2.2871373 3.0187243 2.0415132 0.4355660 

     2.5%       25%       50%       75%     97.5%      mean        sd 
1.3130094 1.7351970 2.0013578 2.3259023 3.0173868 2.0440240 0.4349706 

Interval kepercayaan 95% peningkatan adalah 31% hingga 202%.

GaBorgulya
sumber