Pengujian Hipotesis Poisson untuk Dua Parameter

9

Jadi, untuk bersenang-senang, saya mengambil beberapa data panggilan dari call center tempat saya bekerja dan mencoba melakukan beberapa pengujian hipotesis pada mereka, khususnya jumlah panggilan yang diterima dalam seminggu, dan menggunakan distribusi Poisson agar sesuai. Karena subjek pekerjaan saya, ada dua jenis minggu, mari kita panggil salah satu dari mereka di minggu di mana saya berhipotesis ada lebih banyak panggilan, dan di luar minggu di mana saya berhipotesis ada lebih sedikit.

Saya punya teori bahwa dari pada minggu (sebut saja ) lebih besar daripada yang ada di luar minggu (sebut saja )λ 1 λ 2λλ1λ2

Jadi hipotesis yang ingin saya uji adalahH0:λ1>λ2,H1:λ1λ2

Saya tahu cara menguji satu parameter (katakanlah ) tetapi tidak begitu yakin bagaimana cara melakukan 2 dengan diberikan kumpulan data. Katakanlah saya mengambil data senilai dua minggu dari masing-masing dan untuk libur-minggu dan dan untuk pada-minggu. Dapatkah seseorang membantu memandu saya melalui versi yang lebih sederhana ini sehingga saya dapat menerapkannya pada kumpulan data yang lebih besar? Bantuan apa pun dihargai, terima kasih.X 1 = 2 X 2 = 3 Y 1 = 2 Y 2 = 6H0:λ1>1,H1:λ11X1=2X2=3Y1=2Y2=6

James Snyder
sumber
3
Apakah panggilan benar-benar terdistribusi? Jika ada banyak panggilan, mereka mungkin dimodelkan sebagai kira-kira normal. Tapi itu bisa mematikan kesenangan.
RegressForward
1
Nah apa yang menentukan bagaimana Anda membingkainya dengan benar? Saya menerima x jumlah panggilan diskrit dalam bingkai waktu unit. Saya bisa melakukannya sebagai distribusi normal, tapi dia intinya adalah saya ingin mencobanya dengan Poisson karena cocok.
James Snyder
Jika Anda menganggap bahwa penghitungannya adalah Poisson maka Anda bisa menambahkan penghitungannya (koreksi saya jika saya salah). Artinya Anda akan mendapatkan X = 2 + 3 dan Y = 2 + 6. Anda kemudian dapat menguji perbedaan menggunakan, misalnya, ´poisson.test´ dalam R. Jika Anda ingin mencoba analisis Bayesian, saya juga memiliki posting blog di sini: sumsar.net/blog/2014/ 09 / bayesian-first-aid-poisson-test
Rasmus Bååth

Jawaban:

4

Perhatikan bahwa biasanya persamaannya adalah nol (dengan alasan yang bagus).

Selain masalah itu, saya akan menyebutkan beberapa pendekatan untuk menguji hipotesis semacam ini

  1. Tes yang sangat sederhana: kondisi pada jumlah total yang diamati , yang mengubahnya menjadi uji proporsi binomial. Bayangkan ada on-weeks dan off-minggu dan minggu digabungkan.nwonwoffw

Kemudian di bawah nol, proporsi yang diharapkan masing-masing adalah dan . Anda dapat melakukan tes satu arah dari proporsi pada minggu-minggu dengan cukup mudah.wonwwoffw

  1. Anda bisa membuat tes satu arah dengan mengadaptasi statistik yang terkait dengan uji rasio kemungkinan; bentuk-z dari uji Wald atau tes skor dapat dilakukan satu ekor misalnya dan harus bekerja dengan baik untuk largish .λ

Ada yang lain mengambilnya.

Glen_b -Reinstate Monica
sumber
1

Bagaimana dengan hanya menggunakan GLM dengan struktur kesalahan Poisson dan log-link ??? Tetapi gagasan tentang binomial mungkin lebih kuat.

Ivan Kshnyasev
sumber
Saat ini, ini lebih merupakan komentar daripada jawaban. Apakah Anda bermaksud sebagai komentar, pertanyaan untuk klarifikasi, atau jawaban? Jika yang terakhir, dapatkah Anda mengembangkannya menjadi lebih banyak jawaban? Kami juga dapat mengubahnya menjadi komentar untuk Anda.
gung - Reinstate Monica
1

Saya akan menyelesaikannya dengan Poisson atau Quasi-Poisson GLM dengan preferensi untuk quasi-Poisson atau binomial negatif.

Masalah dengan menggunakan Poisson tradisional adalah bahwa ia memerlukan varians dan rata-rata sama yang sangat mungkin tidak terjadi. Quasi-Poisson atau NB memperkirakan varians tidak dibatasi oleh mean.

Anda dapat melakukannya di R dengan sangat mudah.

# week on = 1, week off = 0
week.status <- c(1, 1, 0, 0)
calls <- c(2, 6, 2, 3)
model <- glm(calls ~ week.status, family = poisson())
# or change the poisson() after family to quasipoisson() 
# or use the neg binomial glm from the MASS package

Pendekatan GLM bermanfaat dan karena Anda dapat memperluas untuk memasukkan variabel tambahan (misalnya, bulan tahun) yang mungkin berdampak pada volume panggilan.

Untuk melakukannya dengan tangan, saya mungkin akan menggunakan pendekatan normal dan uji t dua sampel.

iacobus
sumber
1

Kita mulai dengan Estimasi Kemungkinan Maksimum untuk parameter Poisson, yang artinya.

Jadi,λ^1=Y¯  and  λ^2=X¯

Sekarang, Anda dapat menguji secara sederhanaY¯X¯N(λ1λ2,λ1n1+λ2n2)

dan kemudian membandingkan dengan mendapatkan Z-Value =(Y¯X¯)λ1λ2λ1n1+λ2n2

Catatan: Kriteria -rejection adalahZ<Critical Value

Hemant Rupani
sumber
0

Mulai dari halaman 125 dari Pengujian Hipotesis Statistik Casella jawaban untuk jenis pertanyaan yang telah Anda rumuskan diuraikan. Saya telah melampirkan tautan ke pdf yang saya temukan di internet untuk referensi Anda. Casella's Menguji Hipotesis Statistik, Edisi Ketiga .

Nuzhi Meyen
sumber
Pointer yang bagus, namun hanya tautan-jawaban tidak disarankan pada Cross Validated. Bisakah Anda membuat sketsa resolusi dalam jawaban Anda? Terima kasih.
Xi'an
Maaf saya tidak mengetahui aturan itu. Terima kasih telah memberi tahu saya. :) Akan mencoba memberikan jawaban yang komprehensif sesegera mungkin.
Nuzhi Meyen