Pearson VS Deviance Residuals dalam regresi logistik

16

Saya tahu bahwa residual Pearson terstandarisasi diperoleh dengan cara probabilistik tradisional:

ri=yiπiπi(1πi)

dan Deviance Residuals diperoleh melalui cara yang lebih statistik (kontribusi setiap titik terhadap kemungkinan):

di=si2[yilogπi^+(1yi)log(1πi)]

di mana = 1 jika = 1 dan = -1 jika y_i = 0.y i s i y isiyisiyi

Dapatkah Anda menjelaskan kepada saya, secara intuitif, bagaimana menafsirkan rumus residu penyimpangan?

Apalagi, jika saya ingin memilih satu, mana yang lebih cocok dan mengapa?

BTW, beberapa referensi mengklaim bahwa kami memperoleh residu penyimpangan berdasarkan istilah

12ri2

di mana ri disebutkan di atas.

Jack Shi
sumber
Setiap pikiran akan dihargai
Jack Shi
1
Ketika Anda mengatakan "beberapa referensi" ... referensi mana, dan bagaimana mereka melakukannya?
Glen_b -Reinstate Monica

Jawaban:

10

Regresi logistik berupaya memaksimalkan fungsi kemungkinan log

LL=kln(Pi)+rln(1Pi)

PiY^=1kY=1Y = 0rY=0

Ekspresi itu sama dengan

LL=(kdi2+rdi2)/2

karena residu penyimpangan suatu kasus didefinisikan sebagai:

di={2ln(Pi)if Yi=12ln(1Pi)if Yi=0

Dengan demikian, regresi logistik biner berusaha langsung untuk meminimalkan jumlah residu penyimpangan kuadrat. Ini adalah residu penyimpangan yang tersirat dalam algoritma ML regresi.

Statistik Chi-sq dari kecocokan model adalah , di mana model penuh berisi prediktor dan model yang dikurangi tidak.2(LLfull modelLLreduced model)

ttnphns
sumber