Menafsirkan koefisien regresi logistik dengan istilah regularisasi

Jawaban:

10

Koefisien yang dikembalikan standar dengan kecocokan regresi logistik bukanlah rasio odds. Mereka mewakili perubahan dalam peluang log 'sukses' yang terkait dengan perubahan satu unit dalam variabel masing-masing, ketika semua hal lain dianggap sama. Jika Anda memperkirakan suatu koefisien, maka Anda dapat menginterpretasikan hasilnya sebagai rasio odds (tentu saja, ini tidak benar dari intersep). Lebih lanjut tentang ini dapat ditemukan dalam jawaban saya di sini: Interpretasi prediksi sederhana untuk rasio odds dalam regresi logistik .

Menambahkan penalti pada model fit akan (berpotensi) mengubah nilai kecocokan dari koefisien yang diestimasi, tetapi itu tidak mengubah interpretasi koefisien dalam arti yang dibahas dalam pertanyaan Anda / di atas. *

* (Saya ingin tahu apakah kebingungan tentang pernyataan ini adalah asal dari downvote baru-baru ini.) Untuk lebih jelas: Koefisien yang dipasang pada , mewakili perubahan dalam peluang log keberhasilan yang terkait dengan perubahan 1 unit pada jika tidak ada istilah penalti yang digunakan dalam pemasangan model dan jika istilah penalti digunakan agar sesuai dengan model. Dalam kedua kasus itu bukan rasio odds. Namun, adalah rasio peluang yang terkait dengan perubahan 1 unit di , sekali lagi terlepas dari apakah istilah penalti digunakan untuk cocok dengan model. Model yang dilengkapi dengan hukuman dapat ditafsirkan dalam kerangka Bayesian, tetapi tidak harus seperti itu. Terlebih lagi, bahkan jika itu,X1β^1X1exp(β^1)X1β^1masih mewakili perubahan dalam peluang keberhasilan log yang terkait dengan perubahan 1 unit pada bukan rasio peluang. X1

gung - Pasang kembali Monica
sumber
1
Saya tidak pernah mengerti mengapa orang downvote tanpa meninggalkan komentar. Bagaimanapun, ini adalah jawaban yang bagus.
Digio
7

Regresi linier yang teratur dan regresi logistik yang teratur dapat ditafsirkan dengan baik dari sudut pandang Bayesian. Parameter regularisasi sesuai dengan pilihan distribusi sebelumnya pada bobot, misalnya, sesuatu seperti distribusi normal yang berpusat pada nol dengan standar deviasi yang diberikan oleh kebalikan dari parameter regularisasi. Kemudian melalui data pelatihan Anda, distribusi ini diperbarui untuk akhirnya memberi Anda distribusi posterior pada bobot.

Jadi, misalnya, parameter regularisasi yang lebih besar berarti bahwa, seperti sebelumnya, kami berpikir bahwa bobotnya harus mendekati nol, maka dengan pengaturan ini kecil kemungkinannya bahwa distribusi posterior akan didukung jauh dari nol - yang sesuai dengan intuisi tentang apa yang seharusnya dilakukan oleh regularisasi ".

Untuk sebagian besar implementasi regresi yang diatur, hasil akhir dari bobot hanyalah nilai yang diharapkan dari distribusi posterior.

Omong-omong, regresi yang tidak diatur pada dasarnya dapat diinterpretasikan dengan cara yang sama: itu adalah batas ketika parameter regularisasi menjadi nol.

Kevin H. Lin
sumber
Itu adalah cara yang bagus untuk menginterpretasikan perkiraan linier yang teratur. Apakah jawaban Anda berubah sama sekali ketika "prior" (parameter regularisasi) dipilih berdasarkan data (misalnya, melalui validasi silang)?
Andrew M