Saya agak baru menggunakan regresi logistik, dan sedikit bingung oleh perbedaan antara interpretasi saya terhadap nilai-nilai berikut yang saya pikir akan sama:
- nilai beta eksponensial
- prediksi probabilitas hasil menggunakan nilai beta.
Berikut ini adalah versi sederhana dari model yang saya gunakan, di mana kekurangan gizi dan asuransi keduanya biner, dan kekayaan berkelanjutan:
Under.Nutrition ~ insurance + wealth
Model (aktual) saya mengembalikan nilai beta eksponensial sebesar 0,8 untuk asuransi, yang akan saya artikan sebagai:
"Probabilitas kekurangan gizi untuk individu yang diasuransikan adalah 0,8 kali probabilitas kekurangan gizi untuk individu yang tidak diasuransikan."
Namun, ketika saya menghitung perbedaan probabilitas untuk individu dengan memasukkan nilai 0 dan 1 ke dalam variabel asuransi dan nilai rata-rata untuk kekayaan, perbedaan dalam kekurangan gizi hanya 0,04. Itu dihitung sebagai berikut:
Probability Undernourished = exp(β0 + β1*Insurance + β2*Wealth) /
(1+exp(β0 + β1*Insurance + β2*wealth))
Saya akan sangat menghargainya jika seseorang dapat menjelaskan mengapa nilai-nilai ini berbeda, dan apa interpretasi yang lebih baik (terutama untuk nilai kedua).
Editan Klarifikasi Lebih Lanjut
Seperti yang saya pahami, kemungkinan kurang gizi bagi orang yang tidak diasuransikan (di mana B1 terkait dengan asuransi) adalah:
Prob(Unins) = exp(β0 + β1*0 + β2*Wealth) /
(1+exp(β0 + β1*0+ β2*wealth))
Sedangkan Peluang kurang gizi bagi orang yang diasuransikan adalah:
Prob(Ins)= exp(β0 + β1*1 + β2*Wealth) /
(1+exp(β0 + β1*1+ β2*wealth))
Peluang kekurangan gizi untuk orang yang tidak diasuransikan dibandingkan dengan orang yang diasuransikan adalah:
exp(B1)
Apakah ada cara untuk menerjemahkan antara nilai-nilai ini (secara matematis)? Saya masih agak bingung dengan persamaan ini (di mana saya mungkin harus nilai yang berbeda pada RHS):
Prob(Ins) - Prob(Unins) != exp(B)
Dalam istilah awam, pertanyaannya adalah mengapa tidak mengasuransikan individu mengubah probabilitas mereka kekurangan gizi sebanyak rasio odds menunjukkan hal itu? Dalam data saya, Prob (Ins) - Prob (Unins) = .04, di mana nilai beta eksponensial adalah 0,8 (jadi mengapa perbedaannya bukan .2?)
Jawaban:
Tampaknya jelas bagi saya bahwa kecualiexp(β0+β1x)=0. Jadi, saya kurang jelas tentang apa yang mungkin membingungkan. Apa yang bisa saya katakan adalah bahwa sisi kiri (LHS) dari tanda (tidak) sama denganpeluangkekurangan gizi, sedangkan RHS adalahprobabilitaskekurangan gizi. Ketika diperiksa sendiri,exp(β1), adalahrasio odds, yaitu faktor multiplikasi yang memungkinkan Anda untuk beralih dari odds (
Beri tahu saya jika Anda membutuhkan informasi tambahan / berbeda.
Pembaruan:
Saya pikir ini sebagian besar masalah tidak terbiasa dengan probabilitas dan peluang, dan bagaimana mereka berhubungan satu sama lain. Tidak ada yang sangat intuitif, Anda perlu duduk dan bekerja dengannya sebentar dan belajar berpikir dalam istilah itu; itu tidak datang secara alami kepada siapa pun.
Masalahnya adalah angka absolut sangat sulit untuk ditafsirkan sendiri. Katakanlah saya bercerita tentang waktu ketika saya memiliki koin dan saya bertanya-tanya apakah itu adil. Jadi saya membalik beberapa dan mendapat 6 kepala. Apa artinya? Apakah 6 banyak, sedikit, benar? Sangat sulit untuk dikatakan. Untuk mengatasi masalah ini, kami ingin memberikan sejumlah konteks. Dalam kasus seperti ini ada dua pilihan yang jelas untuk bagaimana memberikan konteks yang dibutuhkan: Saya bisa memberikan jumlah total flips, atau saya bisa memberikan jumlah ekor. Dalam kedua kasus, Anda memiliki informasi yang memadai untuk membuat 6 kepala, dan Anda dapat menghitung nilai lainnya jika yang saya katakan bukan yang Anda sukai. Probabilitas adalah jumlah kepala dibagi dengan jumlah total peristiwa. Peluangnya adalah rasio jumlah kepala dengan jumlah
wealth
(Meskipun ditulis dalam konteks pertanyaan yang berbeda, jawaban saya di sini berisi banyak informasi tentang regresi logistik yang mungkin membantu Anda dalam memahami LR dan masalah terkait lebih lengkap.)
sumber
Yah jawabannya sederhana ketika Anda bersedia untuk menjaga semua variabel konstan dan bervariasi satu variabel. Namun itu menjadi sedikit rumit saat setiap variabel bervariasi. Anda dapat melihat posting berikut, mungkin membantu http://analyticspro.org/2016/03/02/r-tutorial-multiple-linear-regress/
sumber
Odds ratio OR = Exp (b) diterjemahkan menjadi Probability A = SQRT (OR) / (SQRT (OR) +1), di mana Probabilitas A adalah probabilitas Peristiwa A dan OR adalah rasio peristiwa yang terjadi A / tidak terjadi peristiwa A (atau terkena / tidak terkena asuransi seperti dalam pertanyaan di atas). Butuh waktu cukup lama untuk menyelesaikannya; Saya tidak yakin mengapa itu bukan formula yang terkenal.
Ada sebuah contoh. Misalkan, ada 10 orang yang diterima di universitas; 7 dari mereka adalah laki-laki. Jadi, untuk setiap pria itu 70% kemungkinan diterima. Peluang untuk diterima pria adalah 7/3 = 2.33 dan tidak diterima 3/7 = 0.43. Odds ratio (OR) adalah 2,33 / 0,43 = 5,44 yang berarti bahwa untuk pria 5,44 kali lebih tinggi untuk diterima daripada wanita. Mari kita temukan probabilitas untuk diterima manusia dari OR: P = SQRT (5.44) / (SQRT (5.44) +1) = 0.7
Pembaruan Ini berlaku hanya jika jumlah pria atau wanita yang diterima sama dengan jumlah pelamar. Dengan kata lain, itu bukan OR. Kami tidak dapat menemukan perolehan probabilitas (atau kerugian) tergantung pada faktor tanpa mengetahui informasi tambahan.
sumber