Regresi logistik untuk data dari distribusi Poisson

11

Dari beberapa catatan pembelajaran mesin yang berbicara tentang beberapa metode klasifikasi diskriminatif, khususnya regresi logistik, di mana y adalah label kelas (0 atau 1) dan x adalah datanya, dikatakan bahwa:

jika , dan , maka akan menjadi logistik.x|y=0Poisson(λ0)x|y=1Poisson(λ1)p(y|x)

Mengapa ini benar?

sambajetson
sumber

Jawaban:

16

Y memiliki dua nilai yang mungkin untuk setiap nilai diberikan . Menurut asumsi,X

Pr(X=x|Y=0)=exp(λ0)λ0xx!

dan

Pr(X=x|Y=1)=exp(λ1)λ1xx!.

Oleh karena itu (ini adalah kasus sepele dari Teorema Bayes) kemungkinan bahwa bersyarat pada adalah probabilitas relatif dari yang terakhir, yaituY=1X=x

Pr(Y=1|X=x)=exp(λ1)λ1xx!exp(λ1)λ1xx!+exp(λ0)λ0xx!=11+exp(β0+β1x)

dimana

β0=λ1λ0

dan

β1=log(λ1/λ0).

Itu memang adalah model regresi logistik standar.

whuber
sumber