Interpretasi prediksi sederhana untuk rasio odds dalam regresi logistik

29

Saya agak baru menggunakan regresi logistik, dan sedikit bingung oleh perbedaan antara interpretasi saya terhadap nilai-nilai berikut yang saya pikir akan sama:

  • nilai beta eksponensial
  • prediksi probabilitas hasil menggunakan nilai beta.

Berikut ini adalah versi sederhana dari model yang saya gunakan, di mana kekurangan gizi dan asuransi keduanya biner, dan kekayaan berkelanjutan:

Under.Nutrition ~ insurance + wealth

Model (aktual) saya mengembalikan nilai beta eksponensial sebesar 0,8 untuk asuransi, yang akan saya artikan sebagai:

"Probabilitas kekurangan gizi untuk individu yang diasuransikan adalah 0,8 kali probabilitas kekurangan gizi untuk individu yang tidak diasuransikan."

Namun, ketika saya menghitung perbedaan probabilitas untuk individu dengan memasukkan nilai 0 dan 1 ke dalam variabel asuransi dan nilai rata-rata untuk kekayaan, perbedaan dalam kekurangan gizi hanya 0,04. Itu dihitung sebagai berikut:

Probability Undernourished = exp(β0 + β1*Insurance + β2*Wealth) /
                             (1+exp(β0 + β1*Insurance + β2*wealth))

Saya akan sangat menghargainya jika seseorang dapat menjelaskan mengapa nilai-nilai ini berbeda, dan apa interpretasi yang lebih baik (terutama untuk nilai kedua).


Editan Klarifikasi Lebih Lanjut
Seperti yang saya pahami, kemungkinan kurang gizi bagi orang yang tidak diasuransikan (di mana B1 terkait dengan asuransi) adalah:

Prob(Unins) = exp(β0 + β1*0 + β2*Wealth) /
              (1+exp(β0 + β1*0+ β2*wealth))

Sedangkan Peluang kurang gizi bagi orang yang diasuransikan adalah:

Prob(Ins)= exp(β0 + β1*1 + β2*Wealth) /
           (1+exp(β0 + β1*1+ β2*wealth))

Peluang kekurangan gizi untuk orang yang tidak diasuransikan dibandingkan dengan orang yang diasuransikan adalah:

exp(B1)

Apakah ada cara untuk menerjemahkan antara nilai-nilai ini (secara matematis)? Saya masih agak bingung dengan persamaan ini (di mana saya mungkin harus nilai yang berbeda pada RHS):

Prob(Ins) - Prob(Unins) != exp(B)

Dalam istilah awam, pertanyaannya adalah mengapa tidak mengasuransikan individu mengubah probabilitas mereka kekurangan gizi sebanyak rasio odds menunjukkan hal itu? Dalam data saya, Prob (Ins) - Prob (Unins) = .04, di mana nilai beta eksponensial adalah 0,8 (jadi mengapa perbedaannya bukan .2?)

mikrofon
sumber
2
Apakah penjelasan yang luar biasa dan jelas ini berlaku untuk model / regresi log-logistik?

Jawaban:

50

Tampaknya jelas bagi saya bahwa kecualiexp(β0+β1x)=0. Jadi, saya kurang jelas tentang apa yang mungkin membingungkan. Apa yang bisa saya katakan adalah bahwa sisi kiri (LHS) dari tanda (tidak) sama denganpeluangkekurangan gizi, sedangkan RHS adalahprobabilitaskekurangan gizi. Ketika diperiksa sendiri,exp(β1), adalahrasio odds, yaitu faktor multiplikasi yang memungkinkan Anda untuk beralih dari odds (

exp(β0+β1x)exp(β0+β1x)1+exp(β0+β1x)
exp(β0+β1x)=0exp(β1)x ) untuk kemungkinan ( ). x+1

Beri tahu saya jika Anda membutuhkan informasi tambahan / berbeda.

Pembaruan:
Saya pikir ini sebagian besar masalah tidak terbiasa dengan probabilitas dan peluang, dan bagaimana mereka berhubungan satu sama lain. Tidak ada yang sangat intuitif, Anda perlu duduk dan bekerja dengannya sebentar dan belajar berpikir dalam istilah itu; itu tidak datang secara alami kepada siapa pun.

Masalahnya adalah angka absolut sangat sulit untuk ditafsirkan sendiri. Katakanlah saya bercerita tentang waktu ketika saya memiliki koin dan saya bertanya-tanya apakah itu adil. Jadi saya membalik beberapa dan mendapat 6 kepala. Apa artinya? Apakah 6 banyak, sedikit, benar? Sangat sulit untuk dikatakan. Untuk mengatasi masalah ini, kami ingin memberikan sejumlah konteks. Dalam kasus seperti ini ada dua pilihan yang jelas untuk bagaimana memberikan konteks yang dibutuhkan: Saya bisa memberikan jumlah total flips, atau saya bisa memberikan jumlah ekor. Dalam kedua kasus, Anda memiliki informasi yang memadai untuk membuat 6 kepala, dan Anda dapat menghitung nilai lainnya jika yang saya katakan bukan yang Anda sukai. Probabilitas adalah jumlah kepala dibagi dengan jumlah total peristiwa. Peluangnya adalah rasio jumlah kepala dengan jumlah

probability=odds1+odds                odds=probability1probability
exp(β)

[0,1](,+)(0,+)wealth

exp(β0+β1x)exp(β0+β1x)=exp(β0+β1x)1+exp(β0+β1x)exp(β0+β1x)1+exp(β0+β1x)
xx

(Meskipun ditulis dalam konteks pertanyaan yang berbeda, jawaban saya di sini berisi banyak informasi tentang regresi logistik yang mungkin membantu Anda dalam memahami LR dan masalah terkait lebih lengkap.)

gung - Pasang kembali Monica
sumber
Terima kasih atas tanggapannya - Saya lebih lanjut menjelaskan kebingungan saya pada hasil edit di atas.
mike
Sangat menghargai meluangkan waktu untuk menulis penjelasan lengkap - sangat membantu.
mike
Sama-sama, @mike, untuk itulah CV.
gung - Reinstate Monica
Re the Las Vegas odds link: Saya belum pernah ke Vegas, tetapi mencari beberapa harga yang ditawarkan oleh situs-situs yang berbasis di Vegas, di mana mereka mengutip peluang pecahan (sebagai lawan dari moneyline) mereka mengikuti sistem "peluang melawan" Inggris, bukan statistik "peluang menguntungkan". Dengan demikian, "peluang Las Vegas" di tautan Anda tidak sesuai dengan peluang perjudian yang sebenarnya, di mana "9 banding 1" adalah untuk peristiwa yang tidak mungkin , bukan (seperti "9 banding 1" berarti untuk seorang ahli statistik) kemungkinan besar! Sumber kebingungan yang saya coba atasi di sini
Silverfish
@ Silververfish, saya belum pernah ke Las Vegas dalam waktu yang lama. Saya tidak ingat apakah mereka biasanya membuat daftar peluang atau peluang menentang. Meskipun demikian, '4 sampai 5' disebut peluang Las Vegas .
gung - Reinstate Monica
-1

Odds ratio OR = Exp (b) diterjemahkan menjadi Probability A = SQRT (OR) / (SQRT (OR) +1), di mana Probabilitas A adalah probabilitas Peristiwa A dan OR adalah rasio peristiwa yang terjadi A / tidak terjadi peristiwa A (atau terkena / tidak terkena asuransi seperti dalam pertanyaan di atas). Butuh waktu cukup lama untuk menyelesaikannya; Saya tidak yakin mengapa itu bukan formula yang terkenal.

Ada sebuah contoh. Misalkan, ada 10 orang yang diterima di universitas; 7 dari mereka adalah laki-laki. Jadi, untuk setiap pria itu 70% kemungkinan diterima. Peluang untuk diterima pria adalah 7/3 = 2.33 dan tidak diterima 3/7 = 0.43. Odds ratio (OR) adalah 2,33 / 0,43 = 5,44 yang berarti bahwa untuk pria 5,44 kali lebih tinggi untuk diterima daripada wanita. Mari kita temukan probabilitas untuk diterima manusia dari OR: P = SQRT (5.44) / (SQRT (5.44) +1) = 0.7

Pembaruan Ini berlaku hanya jika jumlah pria atau wanita yang diterima sama dengan jumlah pelamar. Dengan kata lain, itu bukan OR. Kami tidak dapat menemukan perolehan probabilitas (atau kerugian) tergantung pada faktor tanpa mengetahui informasi tambahan.

Niksr
sumber
7232
Ya, Anda benar sekali, terima kasih. Saya menemukan bahwa kami tidak dapat mengonversi OR yang diketahui (yang kami dapatkan, misalnya, sebagai hasil regresi logistik) menjadi probabilitas yang didapat atau hilang tanpa mengetahui informasi tentang probabilitas sebelumnya. Saya memasukkan pembaruan ke dalam jawaban saya.
Niksr