Saya memiliki data jumlah (analisis permintaan / penawaran dengan menghitung jumlah pelanggan, tergantung pada - kemungkinan - banyak faktor). Saya mencoba regresi linier dengan kesalahan normal, tetapi plot QQ saya tidak terlalu bagus. Saya mencoba transformasi log dari jawabannya: sekali lagi, plot QQ buruk.
Jadi sekarang, saya mencoba regresi dengan Kesalahan Poisson. Dengan model dengan semua variabel signifikan, saya mendapatkan:
Null deviance: 12593.2 on 53 degrees of freedom
Residual deviance: 1161.3 on 37 degrees of freedom
AIC: 1573.7
Number of Fisher Scoring iterations: 5
Penyimpangan residual lebih besar daripada tingkat kebebasan residual: Saya memiliki penyebaran berlebihan.
Bagaimana saya bisa tahu jika saya perlu menggunakan quasipoisson? Apa tujuan quasipoisson dalam kasus ini? Saya membaca saran ini di "The R Book" oleh Crawley, tapi saya tidak melihat maksudnya atau peningkatan besar dalam kasus saya.
Anda benar, data ini mungkin terlalu banyak disebarluaskan. Quasipoisson adalah obat: Ini memperkirakan parameter skala juga (yang diperbaiki untuk model poisson karena varians juga berarti) dan akan memberikan kecocokan yang lebih baik. Namun, itu tidak lagi kemungkinan maksimum apa yang Anda lakukan, dan tes model tertentu dan indeks tidak dapat digunakan. Diskusi yang baik dapat ditemukan di Venables dan Ripley, Statistik Terapan Modern dengan S (Bagian 7.5) .
Alternatifnya adalah dengan menggunakan model binomial negatif, misalnya
glm.nb()
fungsi dalam paketMASS
.sumber
glm()
danglm.nb()
bertanggung jawab untuk memberikan kesimpulan yang dikalibrasi dengan buruk; masuk akal untuk mengharapkan ketelitian akan dilebih-lebihkan. Akan sangat membantu untuk mengetahui lebih banyak tentang mengapa Anda ingin melakukan regresi ini; mungkin metode yang berperforma lebih baik dalam situasi sampel kecil dapat digunakan sebagai gantinya.