Apa model yang sesuai untuk data jumlah yang tidak terdispersi?

24

Saya mencoba untuk memodelkan data jumlah dalam R yang tampaknya kurang terdispersi (Dispersion Parameter ~ .40). Ini mungkin mengapa model glmdengan family = poissonatau binomial negatif ( glm.nb) tidak signifikan. Ketika saya melihat deskripsi data saya, saya tidak memiliki kemiringan data hitung yang khas dan residu dalam dua kondisi eksperimental saya juga homogen.

Jadi pertanyaan saya adalah:

  1. Apakah saya bahkan harus menggunakan analisis regresi khusus untuk data hitung saya, jika data hitung saya tidak benar-benar berperilaku seperti data hitung? Saya menghadapi ketidaknormalan kadang-kadang (biasanya karena kurtosis), tetapi saya menggunakan metode bootstrap persentil untuk membandingkan cara yang dipangkas (Wilcox, 2012) untuk menjelaskan ketidaknormalan. Bisakah metode untuk menghitung data diganti dengan metode kuat apa pun yang disarankan oleh Wilcox dan direalisasikan dalam paket WRS?

  2. Jika saya harus menggunakan analisis regresi untuk menghitung data, bagaimana saya menjelaskan dispersi yang kurang? Poisson dan distribusi binomial negatif mengasumsikan dispersi yang lebih tinggi, sehingga seharusnya tidak tepat, bukan? Saya berpikir untuk menerapkan distribusi quasi-Poisson , tetapi itu biasanya direkomendasikan untuk dispersi berlebih. Saya membaca tentang model beta-binomial yang tampaknya mampu menjelaskan over-serta underdispersion tersedia dalam VGAMpaket R. Namun penulis tampaknya merekomendasikan distribusi Poisson tilded , tetapi saya tidak dapat menemukannya dalam paket .

Adakah yang bisa merekomendasikan prosedur untuk data yang kurang tersebar dan mungkin memberikan beberapa contoh kode R untuknya?

Sil
sumber
1
Bagaimana Anda tahu data Anda tidak tersebar? Bagaimana Anda menghitung parameter dispersi?
Hong Ooi
1
Ini juga akan membantu untuk memberi tahu kami lebih banyak tentang apa yang Anda minati. Untuk perkiraan titik prediksi linier dan prediksi nilai-nilai, penyebaran kurang jarang merupakan masalah tetapi tes dan interval mungkin tidak perlu konservatif (keluarga kuasi akan membantu dengan itu). Yang mengatakan, untuk pendekatan kemungkinan "normal" memeriksa COM Poisson dan model Poisson umum lainnya.
Momo
@ Hung Ooi: Saya menguji dispersi dengan dispersiontest (Poissonmodel, alternative = c ("kurang")) dan tes ternyata signifikan.
Sil
1
@ Momo: Saya ingin menguji apakah negosiasi pasangan dalam dua kondisi eksperimental berbeda dalam penawaran yang benar yang mereka buat. Penawaran yang benar berarti bahwa pasangan angka mengklaim lebih banyak masalah yang sesuai dengan minat masing-masing tim mereka alih-alih mengklaim isu yang lebih bernilai bagi pihak lain. Pertama, saya bahkan tidak menyadari bahwa ini adalah data hitungan. Maksud Anda Distribusi Conway-Maxwell-Poisson oleh COM Poisson? Terima kasih banyak!
Sil
3
Terima kasih atas info tambahannya. Ya, maksud saya poisson conway-maxwell. Shmueli & co mengembangkan model linear umum kindbof untuk itu, ada juga paket R jika Anda ingin mencobanya.
Momo

Jawaban:

9

Cara terbaik --- dan standar untuk menangani data Poisson yang kurang tersebar adalah dengan menggunakan Poisson umum, atau mungkin model rintangan. Tiga model jumlah parameter juga dapat digunakan untuk data yang kurang tersebar; misalnya Faddy-Smith, Waring, Famoye, Conway-Maxwell dan model hitungan umum lainnya. Satu-satunya kelemahan dengan ini adalah interpretabilitas. Tetapi untuk data yang kurang tersebar umum, Poisson umum harus digunakan. Ini seperti binomial negatif untuk data yang terlalu banyak disebarkan. Saya membahas ini secara terperinci dalam dua buku saya, Modeling Count Data (2014) dan Regresi Binomial Negatif, edisi ke-2, (2011) keduanya oleh Cambridge University Press. Dalam R paket VGAM memungkinkan untuk regresi Poisson (GP) umum. Nilai negatif dari parameter dispersi menunjukkan penyesuaian untuk dispersi kurang. Anda dapat menggunakan model GP untuk data yang terlalu banyak menyebar, tetapi umumnya model NB lebih baik. Ketika tiba saatnya untuk itu, yang terbaik untuk menentukan penyebab untuk penyebaran kurang dan kemudian pilih model yang paling tepat untuk menghadapinya.

Joseph Hilbe
sumber
Selamat datang kembali! Silakan daftar & / atau gabungkan akun Anda (Anda dapat menemukan informasi tentang cara melakukan ini di bagian Akun Saya di pusat bantuan kami ), maka Anda akan dapat mengedit & mengomentari pertanyaan Anda sendiri. (Akun asli Anda ada di sini .)
gung - Reinstate Monica
Bisakah Anda melakukan analisis Poisson umum pada SPSS?
Grace Carroll
3

Saya menemukan Poisson yang tersebar di bawah, yang ada hubungannya dengan frekuensi di mana orang akan memainkan permainan sosial. Ternyata ini adalah karena keteraturan ekstrem di mana orang akan bermain pada hari Jumat. Menghapus data hari Jumat memberi saya perkiraan overdispersed Poisson. Mungkin Anda memiliki opsi untuk mengedit data Anda secara serupa.

Meadowlark Bradsher
sumber
1

Ada situasi di mana penyebaran kurang bersatu dengan nol-inflasi yang khas untuk anak-anak pilihan dihitung oleh individu dari kedua jenis kelamin. Saya belum menemukan cara untuk menangkap ini hingga saat ini

Germaniawerks
sumber