Misalkan saya akan melakukan regresi logistik univariat pada beberapa variabel independen, seperti ini:
mod.a <- glm(x ~ a, data=z, family=binominal("logistic"))
mod.b <- glm(x ~ b, data=z, family=binominal("logistic"))
Saya melakukan perbandingan model (uji rasio kemungkinan) untuk melihat apakah model lebih baik daripada model nol dengan perintah ini
1-pchisq(mod.a$null.deviance-mod.a$deviance, mod.a$df.null-mod.a$df.residual)
Lalu saya membangun model lain dengan semua variabel di dalamnya
mod.c <- glm(x ~ a+b, data=z, family=binomial("logistic"))
Untuk melihat apakah variabel signifikan secara statistik dalam model multivariat, saya menggunakan lrtest
perintah dariepicalc
lrtest(mod.c,mod.a) ### see if variable b is statistically significant after adjustment of a
lrtest(mod.c,mod.b) ### see if variable a is statistically significant after adjustment of b
Saya bertanya-tanya apakah pchisq
metode dan lrtest
metode ini setara untuk melakukan tes loglikelihood? Seperti yang saya tidak tahu cara menggunakan lrtest
untuk model logistik univate.
r
logistic
diagnostic
lokheart
sumber
sumber
epicalc
telah dihapus ( sumber ). Sebuah alternatif bisa jadilmtest
.Jawaban:
Pada dasarnya, ya, asalkan Anda menggunakan perbedaan yang benar dalam kemungkinan log:
dan bukan penyimpangan untuk model nol yang sama dalam kedua kasus. Jumlah df adalah jumlah parameter yang berbeda antara dua model bersarang, di sini df = 1. BTW, Anda dapat melihat kode sumber
lrtest()
hanya dengan mengetikdi prompt R.
sumber
anova(model1, model0)
akan bekerja juga.glm(output ~ 1, data=z, family=binomial("logistic"))
akan menjadi model nol yang lebih alami, yang mengatakan bahwaoutput
dijelaskan oleh suku konstan (intersep) / intersep tersirat dalam semua model Anda, jadi Anda menguji efeka
setelah memperhitungkan intersep.Alternatif adalah
lmtest
paket, yang memilikilrtest()
fungsi yang menerima model tunggal. Berikut adalah contoh dari?lrtest
dalamlmtest
paket, yang untuk LM tetapi ada metode yang bekerja dengan GLM:sumber
fm1
memiliki kemungkinan log yang lebih rendah dan karenanya lebih buruk daripadafm2
. LRT memberi tahu kami bahwa sejauh mana kami membuatfm1
model yang lebih buruk daripada yangfm2
tidak terduga, besar jika istilah yang berbeda di antara model itu berguna (dijelaskan tanggapannya).lrtest(fm2)
tidak dibandingkan denganfm1
sama sekali, modelfm2
dibandingkan dengan dalam kasus itu jika, seperti yang dinyatakan dalam output, ini:con ~ 1
. Model itu, model nol, mengatakan bahwa prediktor terbaikcon
adalah mean sampel daricon
(istilah intersep / konstanta).