Regresi Poisson adalah GLM dengan fungsi log-link.
Cara alternatif untuk memodelkan data jumlah yang tidak terdistribusi secara normal adalah dengan preprocess dengan mengambil log (atau lebih tepatnya, log (1 + count) untuk menangani 0's). Jika Anda melakukan regresi kuadrat-terkecil pada respons penghitungan log, apakah itu terkait dengan regresi Poisson? Bisakah itu menangani fenomena serupa?
regression
poisson-distribution
generalized-linear-model
Brendan OConnor
sumber
sumber
Jawaban:
Di satu sisi, dalam regresi Poisson, sisi kiri persamaan model adalah logaritma penghitungan yang diharapkan: .log(E[Y|x])
Di sisi lain, dalam model linier "standar", sisi kiri adalah nilai yang diharapkan dari variabel respons normal: . Secara khusus, fungsi tautan adalah fungsi identitas.E[Y|x]
Sekarang, katakanlah adalah variabel Poisson dan Anda bermaksud menormalkannya dengan mengambil log: Y ′ = log ( Y ) . Karena Y ′ seharusnya normal, Anda berencana untuk menyesuaikan model linier standar dengan sisi kiri E [ Y ′ | x ] = E [ log ( Y ) | x ] . Namun, secara umum, E [ log ( Y ) | x ] ≠ log ( EY Y′=log(Y) Y′ E[Y′|x]=E[log(Y)|x] . Akibatnya, kedua pendekatan pemodelan ini berbeda.E[log(Y)|x]≠log(E[Y|x])
sumber
Saya melihat dua perbedaan penting.
Pertama, nilai prediksi (pada skala asli) berperilaku berbeda; dalam loglinear-kuadrat mereka mewakili cara geometris bersyarat; dalam model log-poisson mewakili cara bersyarat. Karena data dalam jenis analisis ini sering condong ke kanan, mean geometrik kondisional akan meremehkan mean kondisional.
Perbedaan kedua adalah distribusi tersirat: lognormal versus poisson. Ini berkaitan dengan struktur heteroskedastisitas residual: varians residual sebanding dengan nilai kuadrat yang diharapkan (lognormal) versus varians residual sebanding dengan nilai yang diharapkan (Poisson).
sumber
Satu perbedaan yang jelas adalah bahwa regresi Poisson akan menghasilkan bilangan bulat sebagai prediksi titik sedangkan regresi linier log-hitung dapat menghasilkan non-bilangan bulat.
sumber