Interpretasi prediktor log transformasi dalam regresi logistik
15
Salah satu prediktor dalam model logistik saya telah diubah log. Bagaimana Anda menginterpretasikan koefisien estimasi dari log prediktor yang diubah log dan bagaimana Anda menghitung dampak prediktor itu pada rasio peluang?
Perlakuan yang sangat jelas dan komprehensif untuk pertanyaan ini adalah jawaban jthetzel
rolando2
Terima kasih atas seluruh bantuan Anda. Klarifikasi lebih lanjut. Sebenarnya jika saya bertransformasi menjadi log basis 2- maka sesuai jawaban sebelumnya masuk akal bahwa penggandaan dalam hasil prediksi dalam% kapak perubahan dalam hasil.
mp77
Jawaban:
16
Jika Anda memperkirakan koefisien yang diperkirakan, Anda akan mendapatkan rasio peluang yang terkait dengan peningkatan kali lipatb pada prediktor, di mana adalah basis dari logaritma yang Anda gunakan saat mengubah log prediktor.b
Saya biasanya memilih untuk mengambil logaritma ke basis 2 dalam situasi ini, jadi saya bisa memadukan koefisien eksponensial sebagai rasio odds yang terkait dengan penggandaan prediktor.
Menarik. Saya selalu menggunakan log natural karena banyak koefisien cenderung mendekati nol dan kemudian dapat ditafsirkan sebagai perbedaan proporsional (relatif). Itu tidak mungkin dalam basis logaritma lainnya. Saya melihat ada gunanya menggunakan basis lain, tapi saya pikir Anda perlu mengklarifikasi respons Anda, karena interpretasi utama Anda tidak menggunakan nilai koefisien sama sekali!
whuber
@whuber maaf apa yang dilakukan prima facie ? Wajah pertama ??
@gung sepenuhnya benar, namun, jika Anda tidak memutuskan untuk menyimpannya, Anda dapat menafsirkan koefisien telah berpengaruh pada setiap beberapa dari IV, daripada setiap penambahan dari IV.
Satu IV yang sering harus diubah adalah pendapatan. Jika Anda memasukkannya tanpa diubah, maka masing-masing (katakanlah) peningkatan pendapatan $ 1.000 akan berdampak pada rasio peluang sebagaimana ditentukan oleh rasio peluang. Di sisi lain, jika Anda mengambil log (10) dari pendapatan, maka setiap kenaikan 10 kali lipat dalam pendapatan akan berdampak pada rasio odds yang ditentukan dalam rasio odds.
Masuk akal untuk melakukan ini untuk pendapatan karena, dalam banyak hal, peningkatan pendapatan $ 1.000 jauh lebih besar bagi seseorang yang menghasilkan $ 10.000 per tahun daripada seseorang yang menghasilkan $ 100.000.
Satu catatan terakhir - meskipun regresi logistik tidak membuat asumsi normal, bahkan regresi OLS tidak membuat asumsi tentang variabel, itu membuat asumsi tentang kesalahan, seperti yang diperkirakan oleh residu.
+1, poin bagus. Saya kira saya bisa lebih lengkap. Selain itu, saya mematikan mathjax yang tidak disengaja dengan meletakkan backslash "\" segera sebelum dolar menandatangani. Saya harap kamu tidak keberatan.
gung - Reinstate Monica
Apa yang Anda maksud dengan 'regresi logistik membuat asumsi tentang kesalahan'?
Tidak, regresi OLS membuat asumsi tentang kesalahan. Itu yang aku katakan.
Peter Flom - Reinstate Monica
3
Jawaban ini diadaptasi dari The Statistical Sleuth oleh Fred L. Ramsey dan Daniel W. Schafer.
Jika persamaan model Anda adalah:
log(p/(1−p))=β0+βlog(X)
kXkβ
Sebagai contoh, saya memiliki model berikut untuk keberadaan luka tempat tidur mundur selama tinggal di rumah sakit.
log(oddsofbedsore)=−.44+0.45(lengthofstay)
β=0.45 .
k , berdasarkan apa yang paling cocok untuk interpretabilitas model Anda.
k=2
kβ=20.45=1.37
k=2
k=0.5
kβ= 0,50,45= 0,73
Masing-masing membagi dua (k = 0,5) lama tinggal dikaitkan dengan perubahan peluang mendapatkan luka baring dengan faktor 0,73. Atau jika Anda memotong lama saya tinggal di setengah, peluang saya mendapatkan luka baring hanya akan 73% dari yang seharusnya.
Jawaban:
Jika Anda memperkirakan koefisien yang diperkirakan, Anda akan mendapatkan rasio peluang yang terkait dengan peningkatan kali lipatb pada prediktor, di mana adalah basis dari logaritma yang Anda gunakan saat mengubah log prediktor.b
Saya biasanya memilih untuk mengambil logaritma ke basis 2 dalam situasi ini, jadi saya bisa memadukan koefisien eksponensial sebagai rasio odds yang terkait dengan penggandaan prediktor.
sumber
@gung sepenuhnya benar, namun, jika Anda tidak memutuskan untuk menyimpannya, Anda dapat menafsirkan koefisien telah berpengaruh pada setiap beberapa dari IV, daripada setiap penambahan dari IV.
Satu IV yang sering harus diubah adalah pendapatan. Jika Anda memasukkannya tanpa diubah, maka masing-masing (katakanlah) peningkatan pendapatan $ 1.000 akan berdampak pada rasio peluang sebagaimana ditentukan oleh rasio peluang. Di sisi lain, jika Anda mengambil log (10) dari pendapatan, maka setiap kenaikan 10 kali lipat dalam pendapatan akan berdampak pada rasio odds yang ditentukan dalam rasio odds.
Masuk akal untuk melakukan ini untuk pendapatan karena, dalam banyak hal, peningkatan pendapatan $ 1.000 jauh lebih besar bagi seseorang yang menghasilkan $ 10.000 per tahun daripada seseorang yang menghasilkan $ 100.000.
Satu catatan terakhir - meskipun regresi logistik tidak membuat asumsi normal, bahkan regresi OLS tidak membuat asumsi tentang variabel, itu membuat asumsi tentang kesalahan, seperti yang diperkirakan oleh residu.
sumber
Jawaban ini diadaptasi dari The Statistical Sleuth oleh Fred L. Ramsey dan Daniel W. Schafer.
Jika persamaan model Anda adalah:
Sebagai contoh, saya memiliki model berikut untuk keberadaan luka tempat tidur mundur selama tinggal di rumah sakit.
Masing-masing membagi dua (k = 0,5 ) lama tinggal dikaitkan dengan perubahan peluang mendapatkan luka baring dengan faktor 0,73. Atau jika Anda memotong lama saya tinggal di setengah, peluang saya mendapatkan luka baring hanya akan 73% dari yang seharusnya.
sumber