Memilih alternatif untuk regresi Poisson untuk data jumlah overdispersed

12

Saat ini saya menganalisis data dari serangkaian eksperimen perilaku yang semuanya menggunakan ukuran berikut. Para peserta dalam percobaan ini diminta untuk memilih petunjuk yang (fiktif) dapat digunakan orang lain untuk membantu memecahkan serangkaian 10 anagram. Para peserta dituntun untuk percaya bahwa orang lain ini akan mendapatkan atau kehilangan uang, tergantung pada kinerja mereka dalam menyelesaikan anagram. Petunjuk bervariasi dalam membantu mereka. Misalnya, untuk anagram NUNGRIN, anagram RUNNING, tiga petunjuk mungkin:

  1. Bergerak cepat (tidak membantu)
  2. Apa yang Anda lakukan dalam perlombaan maraton (membantu)
  3. Tidak selalu hobi yang sehat (tidak membantu)

Untuk membentuk ukuran, saya menghitung berapa kali (dari 10) peserta memilih petunjuk yang tidak membantu untuk orang lain. Dalam percobaan, saya menggunakan berbagai manipulasi berbeda untuk memengaruhi manfaat petunjuk yang dipilih orang.

Karena ukuran help / unhelpfulness cenderung sangat positif (sebagian besar orang selalu memilih 10 petunjuk yang paling membantu), dan karena ukurannya adalah variabel jumlah, saya telah menggunakan Poisson Generalized Linear Model untuk menganalisis data ini. Namun, ketika saya melakukan beberapa bacaan lagi tentang regresi Poisson, saya menemukan bahwa karena regresi Poisson tidak secara independen memperkirakan rata-rata dan varians dari suatu distribusi, sering meremehkan varians dalam satu set data. Saya mulai menyelidiki alternatif untuk regresi Poisson, seperti regresi quasipoisson atau regresi binomial negatif. Namun, saya akui bahwa saya agak baru dalam model-model ini, jadi saya datang ke sini untuk meminta nasihat.

Adakah yang punya rekomendasi tentang model mana yang akan digunakan untuk data jenis ini? Adakah pertimbangan lain yang harus saya perhatikan (misalnya, apakah satu model tertentu lebih kuat dari yang lain?)? Diagnosis macam apa yang harus saya perhatikan untuk menentukan apakah model yang saya pilih menangani data saya dengan tepat?

Patrick S. Forscher
sumber
Bagaimana dengan penaksir varians / kovarian yang kuat untuk mengendurkan asumsi bahwa variansnya sama dengan mean?
boscovich
2
Karena mereka menghitung data dan non-negatif, bagaimana dengan quassi-poisson atau model regresi binomial negatif, yang menyebabkan dispersi?
Arun
1
Saya telah berpikir tentang menggunakan model quasi-poisson atau binomial negatif, tetapi apa yang saya tidak mengerti adalah jenis diagonistik apa yang harus dilihat untuk meyakinkan diri saya bahwa saya memodelkan data saya dengan tepat. Karena ada beberapa alternatif (quasi-poisson, binomial negatif, dan model "zero-augmented"), saya juga bertanya-tanya apakah ada cara yang baik untuk memilih di antara alternatif-alternatif ini. Misalnya, apakah satu metode umumnya lebih kuat daripada yang lain?
Patrick S. Forscher
1
Itu tergantung data. Mengapa tidak mencocokkan semuanya dengan data Anda (Poisson, binomial negatif, Poisson nol-meningkat dan binomial negatif, model rintangan untuk mereka yang dipermasalahkan) dan membandingkannya melalui katakanlah, AIC atau BIC? Lihat cran.r-project.org/web/packages/pscl/vignettes/countreg.pdf Lalu pilih yang paling cocok untuk data Anda. Anda mungkin juga menggunakan model quasi-likelihood, tapi itu masalah selera, saya tidak begitu menyukainya.
Momo
1
Untuk memeriksa distribusi apa yang mungkin merupakan model yang baik untuk respons Anda, Anda dapat menggunakan fungsi vcd :: distplot.
Momo

Jawaban:

12

Hasil Anda adalah jumlah petunjuk bermanfaat dari 10, yang merupakan variabel acak binomial. Jadi Anda harus menganalisisnya dengan semacam regresi binomial, mungkin kuasi-binomial untuk memungkinkan penyebaran berlebihan. Perhatikan bahwa Poisson dan distribusi binomial negatif yang diberi nama salah cocok untuk data jumlah tak terbatas.

Aniko
sumber
2
Saya menyebutkan binomial negatif karena merupakan alternatif overdispersed untuk Poisson yang poser menyarankan pada awalnya. Karena setiap responden memiliki x / 10 petunjuk itu bisa jadi binomial tetapi untuk masing-masing dari 10 petunjuk ada pi probabilitas tetap untuk responden engan dan kejadian independen. Mungkin itu masalahnya.
Michael R. Chernick
2
beta-binomial adalah kemungkinan lain (beta-binomial adalah untuk binomial seperti binomial negatif adalah untuk Poisson). betabindalam aodpaket akan melakukannya.
Ben Bolker
5

Saya juga akan merekomendasikan melihat binomial negatif jika hasil yang mungkin tak terbatas seperti untuk Poisson. Anda mungkin ingin membaca salah satu buku Joe Hilbe. Dia punya satu di GEE dan satu di regresi binomial negatif yang dia kontras dengan regresi Poisson. Tetapi seperti yang ditunjukkan oleh Aniko hanya ada 10 petunjuk sehingga setiap responden hanya dapat memiliki 0, 1, 2, 3, ..., 10 dan karenanya Poisson maupun eksponensial negatif tidak sesuai.

Michael R. Chernick
sumber
4

Poin bagus dari @Aniko. Pilihan lain adalah regresi Beta. Ada sebuah makalah dengan judul "Pemeras Lemon Lebih Baik" yang memberi banyak informasi tentang metode ini.

Peter Flom - Pasang kembali Monica
sumber
2
Tetapi beta akan digunakan untuk memodelkan proporsi dan bukan variabel hitungan pada himpunan bilangan bulat yang terbatas.
Michael R. Chernick
Ini memiliki kegunaan yang lebih luas, @MichaelChernick, lihat artikelnya, yang cukup bagus.
Peter Flom - Reinstate Monica
@PeterFlom Ini juga tidak bisa menangani data pada interval [0,1], hanya (0,1).
Colin