Saya mencoba untuk mencocokkan data dengan GLM (regresi poisson) di R. Ketika saya merencanakan residual vs nilai-nilai yang dipasang, plot membuat beberapa (hampir linier dengan kurva cekung kecil) "garis". Apa artinya ini?
library(faraway)
modl <- glm(doctorco ~ sex + age + agesq + income + levyplus + freepoor +
freerepa + illness + actdays + hscore + chcond1 + chcond2,
family=poisson, data=dvisits)
plot(modl)
homework
karena Anda berbicara tentang tugas.table(dvisits$doctorco)
. Apa hubungannya 10 garis lengkung pada plot Anda, dalam tabel ini? Juga, dengan lebih dari 5000 pengamatan, jangan terlalu khawatir tentang penyesuaian koefisien regresi.Jawaban:
Ini adalah penampilan yang Anda harapkan dari plot seperti itu ketika variabel dependen terpisah.
Setiap jejak titik lengkung pada plot sesuai dengan nilai tetap dari variabel dependen y . Setiap kasus di mana y = k memiliki prediksi y ; residu - menurut definisi - sama dengan k - y . Plot k - y vs yk y y=k y^ k−y^ k−y^ y^ jelas garis dengan kemiringan . Dalam regresi Poisson, sumbu x ditunjukkan pada skala log: itu adalah log ( y ) . Kurva sekarang membungkuk secara eksponensial. Sebagai k−1 log(y^) k bervariasi, kurva ini naik dengan jumlah yang tidak terpisahkan. Eksponensial mereka memberikan satu set kurva kuasi-paralel. (Untuk membuktikan ini, plot akan secara eksplisit dibangun di bawah, secara terpisah mewarnai titik dengan nilai .)y
Kita dapat mereproduksi plot yang dimaksud cukup dekat dengan menggunakan model yang serupa tetapi sewenang-wenang (menggunakan koefisien acak kecil):
sumber
Kadang-kadang garis-garis seperti ini dalam plot residual mewakili poin dengan (hampir) nilai yang diamati identik yang mendapatkan prediksi berbeda. Lihatlah nilai target Anda: berapa nilai uniknya? Jika saran saya benar, seharusnya ada 9 nilai unik dalam kumpulan data pelatihan Anda.
sumber
Pola ini adalah karakteristik dari kecocokan keluarga dan / atau tautan yang salah. Jika Anda memiliki data penularan berlebih maka mungkin Anda harus mempertimbangkan distribusi binomial (jumlah) atau gamma (kontinu) negatif. Anda juga harus merencanakan residu Anda terhadap prediktor linier yang ditransformasikan, bukan prediktor saat menggunakan model linier umum. Untuk mengubah prediktor Poisson, Anda perlu mengambil 2 kali akar kuadrat dari prediktor linier dan plot residu Anda terhadap itu. Residu lebih lanjut tidak boleh hanya residual pearson, coba residu deviance dan resi-resimen yang dikerjakan siswa.
sumber