Berikut adalah daftar koefisien regresi logistik (yang pertama adalah intersep)
-1059.61966694592
-1.23890500515482
-8.57185269220438
-7.50413155570413
0
1.03152408392552
1.19874787949191
-4.88083274930613
-5.77172565873336
-1.00610998453393
Saya merasa aneh bagaimana intersepnya sangat rendah dan saya memiliki koefisien yang sebenarnya sama dengan 0. Saya tidak sepenuhnya yakin bagaimana saya akan menafsirkannya. Apakah 0 mengindikasikan bahwa variabel spesifik tidak mempengaruhi sama sekali pada model? Tetapi intersep yang dilakukan dengan memasukkan kolom seseorang tiba-tiba sangat penting? Atau apakah data saya hanya omong kosong dan model tidak dapat masuk dengan benar.
regression
logistic
shiu6rewgu
sumber
sumber
Jawaban:
Adapun koefisien 0, itu berarti bahwa variabel itu tidak berpengaruh, seperti yang Anda sarankan. Sekarang, cukup masuk akal bahwa suatu variabel tidak akan memiliki efek, meskipun demikian, pada dasarnya Anda tidak akan pernah mendapatkan koefisien tepat 0. Saya tidak tahu mengapa itu terjadi dalam kasus ini; komentar menawarkan beberapa kemungkinan saran. Saya dapat menawarkan yang lain, yaitu mungkin tidak ada variasi dalam variabel itu. Misalnya, jika Anda memiliki variabel yang berisi kode untuk jenis kelamin, tetapi hanya perempuan dalam sampel Anda. Saya tidak tahu apakah itu jawaban yang sebenarnya (R, misalnya, kembali
NA
dalam kasus itu, tetapi perangkat lunak berbeda) - itu hanya saran lain.sumber
Menafsirkan intersep
Anda dapat menganggap regresi logistik sebagai kemungkinan posterior untuk menjadi '1'. Intersep mewakili prior pada kategori yang berasal dari dataset: khususnya, ini adalah estimasi empiris dari log (p (Y = 1) / p (Y = 0), dengan sendirinya ketika model hanya memiliki intersep, untuk kasus-kasus di kelas 'referensi' ketika ada kovariat kategoris, dan untuk kasus-kasus ketika kovariat berada pada 0 lebih umum (tetapi kurang dapat diartikan), maka angka negatif Anda mungkin memberi tahu Anda bahwa '1 jarang di antara kasus dalam sampel Anda yang ditandai oleh memiliki semua kovariat di 0. Sekali lagi, mungkin tidak ada pengamatan di sana, jadi tidak ada gunanya mengkhawatirkan nilai intersepsi. Diskusi ini cukup jelas.
Karena pemisahan kekhawatiran yang praktis ini di antara parameter, Anda dapat mengoreksi ketidakseimbangan kategori dengan melatih sampel seimbang yang lebih baik dan hanya menyesuaikan intersep . Lihat King dan Zeng untuk diskusi menyeluruh.
sumber