Residu dalam regresi poisson

9

Zuur 2013 Beginners Guide to GLM & GLMM menyarankan validasi regresi Poisson dengan memplot residu Pearsons terhadap nilai yang dipasang. Zuur menyatakan kita seharusnya tidak melihat residu mengembang saat nilai pas meningkat, seperti plot yang dilampirkan (digambar tangan).

Tapi saya pikir karakteristik utama dari distribusi Poisson adalah varians meningkat dengan meningkatnya rata-rata. Jadi bukankah kita seharusnya melihat peningkatan variasi dalam residu karena nilai pas meningkat?

masukkan deskripsi gambar di sini

luciano
sumber

Jawaban:

25

Perbedaannya jelas segera setelah Anda memahami apa itu residu Pearson.

Anda benar bahwa untuk model Poisson, varians meningkat dengan meningkatnya mean.

Akibatnya, residu mentah biasa ( ) harus memiliki spread yang meningkat dengan nilai yang sesuai (meskipun tidak dalam proporsi).rsaya=ysaya-μ^saya

Namun, residu Pearson adalah residu dibagi dengan akar kuadrat dari varians sesuai dengan model ( untuk model Poisson). Ini berarti bahwa jika modelnya benar, residu Pearson harus memiliki penyebaran konstan.rsayaP=ysaya-μ^sayaμ^saya

Plot residual dari model regresi Poisson disimulasikan sederhana.  Plot kiri: residu mentah vs rata rata menunjukkan peningkatan penyebaran dengan rata-rata.  Ada "garis" diagonal dalam residu karena datanya terpisah.  Plot kanan: Residu Pearson menunjukkan apa yang tampak seperti penyebaran konstan sebagai perubahan berarti, dan pita diagonal sekarang melengkung.

Glen_b -Reinstate Monica
sumber
Bisakah Anda menjelaskan mengapa Anda menulis bahwa kami membaginya dengan akar kuadrat dari varians ketika Anda benar-benar membaginya dengan akar kuadrat dari nilai yang diharapkan? Saya tahu varians sama dengan rata-rata untuk distribusi poisson, tetapi itu adalah konstan untuk distribusi tertentu, jadi varian apa yang kita bicarakan di sini?
kdarras
1
Distribusi kondisional dari respons mungkin berbeda pada setiap kombinasi prediktor. Oleh karena itu penggunaan subskrip pada mean; adalah mean populasi (dan dengan demikian juga varians populasi) untuk pengamatan , mengingat nilai prediktornya (nilai-nilai dari IV-nya). μsayasaya
Glen_b -Reinstate Monica