Saya ingin menguji regresi mana yang paling cocok dengan data saya. Variabel dependen saya adalah hitungan, dan memiliki banyak nol.
Dan saya perlu bantuan untuk menentukan model dan keluarga apa yang akan digunakan (poisson atau quasipoisson, atau regresi poisson nol-inflasi), dan bagaimana menguji asumsi.
- Regresi Poisson: sejauh yang saya mengerti, asumsi kuat adalah bahwa variabel dependen mean = varians. Bagaimana Anda menguji ini? Seberapa dekat mereka seharusnya? Apakah mean dan varian tidak bersyarat atau bersyarat digunakan untuk ini? Apa yang harus saya lakukan jika asumsi ini tidak berlaku?
- Saya membaca bahwa jika varians lebih besar dari rata-rata, kami memiliki penyebaran berlebihan, dan cara potensial untuk mengatasinya termasuk variabel yang lebih independen, atau family = quasipoisson. Apakah distribusi ini memiliki persyaratan atau asumsi lain? Tes apa yang saya gunakan untuk melihat apakah (1) atau (2) lebih cocok - cukup
anova(m1,m2)
? - Saya juga membaca bahwa distribusi binomial negatif dapat digunakan ketika overdispersi muncul. Bagaimana saya melakukan ini di R? Apa bedanya dengan quasipoisson?
Zero-inflated Poisson Regression: Saya membaca bahwa menggunakan tes vuong memeriksa model mana yang lebih baik.
> vuong (model.poisson, model.zero.poisson)
Apakah itu benar? Asumsi apa yang dimiliki regresi nol-inflasi?
Layanan Teknologi Akademik UCLA, Statistik Consulting Group memiliki bagian tentang Regresi Poisson nol-meningkat, dan menguji model zeroinflated (a) terhadap model poisson standar (b):
> m.a <- zeroinfl(count ~ child + camper | persons, data = zinb)
> m.b <- glm(count ~ child + camper, family = poisson, data = zinb)
> vuong(m.a, m.b)
Saya tidak mengerti apa yang dilakukan oleh | persons
bagian dari model pertama, dan mengapa Anda dapat membandingkan model-model ini. Saya mengharapkan regresi sama dan hanya menggunakan keluarga yang berbeda.
stat.desc (dep_var) - dan lihat apakah mean dan variansnya sama. Dari sini Anda juga dapat menghitung% dari nol di vektor Anda.
sumber