Mengapa koefisien regresi logistik eksponensial dianggap "rasio odds"?

10

Regresi logistik memodelkan peluang log dari suatu peristiwa karena sejumlah peramal. Yaitu, log (p / (1-p)) di mana p adalah probabilitas dari beberapa hasil. Dengan demikian, interpretasi koefisien regresi logistik mentah untuk beberapa variabel (x) harus pada skala peluang log. Artinya, jika koefisien untuk x = 5 maka kita tahu bahwa 1 unit perubahan dalam koresponden x menjadi 5 unit perubahan pada skala peluang log yang hasilnya akan terjadi.

Namun, saya sering melihat orang menafsirkan koefisien regresi logistik eksponensial sebagai rasio odds. Namun, jelas exp (log (p / (1-p))) = p / (1-p), yang merupakan peluang. Sejauh yang saya pahami, rasio peluang adalah peluang dari satu peristiwa yang terjadi (misalnya, p / (1-p) untuk peristiwa A) dibandingkan dengan peluang peristiwa lain yang terjadi (misalnya, p / (1-p) untuk acara B).

Apa yang kulewatkan di sini? Sepertinya interpretasi yang umum dari koefisien regresi logistik eksponensial ini tidak benar.

mendongkrak
sumber

Jawaban:

10

@Loniconic jawaban yang bagus dan lengkap, menurut saya. Sesuatu yang ingin saya tambahkan adalah bahwa koefisien asli menggambarkan perbedaan dalam peluang log untuk dua unit yang berbeda dengan 1 dalam prediktor. Misalnya, untuk koefisien pada dari 5, kita dapat mengatakan bahwa perbedaan dalam peluang log antara dua unit yang berbeda pada dengan 1 adalah 5. Secara matematis,XXX

β=log(odds(p|X=x0+1))log(odds(p|X=x0))

Saat Anda menggunakan , Anda dapatkanβ

exp(β)=exp(log(odds(p|X=x0+1))log(odds(p|X=x0)))=exp(log(odds(p|X=x0+1)))exp(log(odds((p|X=x0)))=odds(p|X=x0+1)odds(p|X=x0))

yang merupakan rasio peluang, rasio peluang.

Nuh
sumber
2
Ini sangat jelas bagi saya. Pertanyaan saya terpecahkan.
jack
10

Pertimbangkan dua set kondisi, pertama dijelaskan oleh vektor dari variabel independen , dan yang kedua dijelaskan oleh vektor , yang berbeda hanya dalam engan variabel , dan dengan satu unit. Biarkan menjadi vektor parameter model seperti biasa.XXx i βXxiβ

Menurut model regresi logistik, probabilitas peristiwa yang terjadi dalam kasus pertama adalah , sehingga peluang kejadian yang terjadi adalah . p1p1=11+exp(Xβ)hal11-hal1=exp(Xβ)

Probabilitas peristiwa yang terjadi dalam kasus kedua adalah , sehingga kemungkinan kejadian yang terjadi adalah . p2hal2=11+exp(-Xβ)hal21-hal2=exp(Xβ)=exp(Xβ+βsaya)

Karenanya, rasio peluang dalam kasus kedua dengan peluang dalam kasus pertama adalah . Oleh karena itu interpretasi eksponensial parameter sebagai rasio odds.exp(βsaya)

The Laconic
sumber