Saya tahu bahwa residual Pearson terstandarisasi diperoleh dengan cara probabilistik tradisional:
dan Deviance Residuals diperoleh melalui cara yang lebih statistik (kontribusi setiap titik terhadap kemungkinan):
di mana = 1 jika = 1 dan = -1 jika y_i = 0.y i s i y i
Dapatkah Anda menjelaskan kepada saya, secara intuitif, bagaimana menafsirkan rumus residu penyimpangan?
Apalagi, jika saya ingin memilih satu, mana yang lebih cocok dan mengapa?
BTW, beberapa referensi mengklaim bahwa kami memperoleh residu penyimpangan berdasarkan istilah
di mana disebutkan di atas.
Jawaban:
Regresi logistik berupaya memaksimalkan fungsi kemungkinan log
Ekspresi itu sama dengan
karena residu penyimpangan suatu kasus didefinisikan sebagai:
Dengan demikian, regresi logistik biner berusaha langsung untuk meminimalkan jumlah residu penyimpangan kuadrat. Ini adalah residu penyimpangan yang tersirat dalam algoritma ML regresi.
Statistik Chi-sq dari kecocokan model adalah , di mana model penuh berisi prediktor dan model yang dikurangi tidak.2(LLfull model−LLreduced model)
sumber