Dari exp (koefisien) ke Odds Ratio dan interpretasinya dalam Regresi Logistik dengan faktor

14

Saya menjalankan regresi linear penerimaan ke perguruan tinggi terhadap nilai SAT dan latar belakang keluarga / etnis. Datanya fiksi. Ini adalah tindak lanjut dari pertanyaan sebelumnya, sudah dijawab. Pertanyaannya berfokus pada pengumpulan dan interpretasi rasio odds ketika meninggalkan skor SAT untuk kesederhanaan.

Variabelnya adalah Accepted(0 atau 1) dan Background("merah" atau "biru"). Saya mengatur data sehingga orang-orang dengan latar belakang "merah" lebih mungkin untuk masuk:

fit <- glm(Accepted~Background, data=dat, family="binomial")
exp(cbind(Odds_Ratio_RedvBlue=coef(fit), confint(fit)))

                        Odds_Ratio_RedvBlue             2.5 %       97.5 %
(Intercept)             0.7088608                     0.5553459   0.9017961
Backgroundred           2.4480042                     1.7397640   3.4595454

Pertanyaan:

  1. Apakah 0,7 rasio aneh seseorang dengan latar belakang "biru" diterima? Saya menanyakan ini karena saya juga mendapatkan 0,7 untuk " Backgroundblue" jika saya menjalankan kode berikut:

    fit <- glm(Accepted~Background-1, data=dat, family="binomial")
    exp(cbind(OR=coef(fit), confint(fit)))
  2. SEBUAHccehalted/Red:SEBUAHccehalted/BlkamueHAIddsBlkamue=1/HAIddsRed

Antoni Parellada
sumber
1
Apa yang Rsecara eksplisit menyebut koefisien (melalui fungsi coef) yang Anda panggil "odds ratio" di output Anda. Itu menunjukkan Anda mungkin ingin meninjau perbedaan antara keduanya.
whuber
Saya memang membaca posting di hyperlink Anda.
Antoni Parellada
Koefisien-koefisien tersebut adalah eksponensial: exp (coef (fit)).
Antoni Parellada
Ya: dan seperti yang dijelaskan dalam jawaban saya di utas itu, eksponensial intersep memberi Anda kemungkinan kasus referensi.
whuber

Jawaban:

13

Saya telah berupaya menjawab pertanyaan saya dengan menghitung rasio odds dan odds secara manual:

Acceptance   blue            red            Grand Total
0            158             102                260
1            112             177                289
Total        270             279                549

Jadi Odds Ratio untuk masuk ke sekolah Red over Blue adalah:

HAIdds SEBUAHccehalt sayaf RedHAIdds SEBUAHcccehalt sayaf Blkamue=177/102112/158=1.73530,7089=2.448

Dan ini adalah Backgroundredkembalinya:

fit <- glm(Accepted~Background, data=dat, family="binomial")
exp(cbind(Odds_and_OR=coef(fit), confint(fit)))

                      Odds_and_OR                         2.5 %      97.5 %
(Intercept)             0.7088608                     0.5553459   0.9017961
Backgroundred           2.4480042                     1.7397640   3.4595454

Pada saat yang sama, (Intercept)sesuai dengan pembilang dari112/158=0,7089

Jika sebaliknya, saya jalankan:

fit2 <- glm(Accepted~Background-1, data=dat, family="binomial")
exp(cbind(Odds=coef(fit2), confint(fit2)))

                        Odds            2.5 %      97.5 %
Backgroundblue     0.7088608        0.5553459   0.9017961
Backgroundred      1.7352941        1.3632702   2.2206569

Pengembaliannya justru peluang menjadi 'biru': Backgroundblue(0,7089) dan peluang diterima menjadi 'merah': Backgroundred(1,7353). Tidak ada Rasio Peluang di sana. Oleh karena itu dua nilai kembali tidak diharapkan bersifat timbal balik.

Akhirnya, Bagaimana cara membaca hasil jika ada 3 faktor dalam kategori regressor?

Penghitungan manual yang sama dengan [R]:

Saya membuat set data fiktif yang berbeda dengan premis yang sama, tetapi kali ini ada tiga latar belakang etnis: "merah", "biru" dan "oranye", dan menjalankan urutan yang sama:

Pertama, tabel kontingensi:

Acceptance  blue    orange  red   Total
0             86        65  130     281
1             64        42  162     268
Total        150       107  292     549

Dan menghitung Peluang masuk untuk setiap kelompok etnis:

  • Peluang Terima Jika Merah = 1,246154;
  • Peluang Terima Jika Biru = 0,744186;
  • Peluang Terima Jika Oranye = 0,646154

Serta berbeda Rasio Odds yang :

  • ATAU merah v biru = 1.674519;
  • ATAU merah v oranye = 1.928571;
  • ATAU biru v merah = 0,597186;
  • ATAU biru v oranye = 1.151717;
  • ATAU oranye v merah = 0,518519; dan
  • ATAU oranye v biru = 0,868269

Dan dilanjutkan dengan regresi logistik rutin yang sekarang diikuti oleh eksponen koefisien:

fit <- glm(Accepted~Background, data=dat, family="binomial")
exp(cbind(ODDS=coef(fit), confint(fit)))

                      ODDS     2.5 %   97.5 %
(Intercept)      0.7441860 0.5367042 1.026588
Backgroundorange 0.8682692 0.5223358 1.437108
Backgroundred    1.6745192 1.1271430 2.497853

Menghasilkan peluang masuk untuk "blues" sebagai (Intercept), dan Odds Ratios of Orange versus Blue in Backgroundorange, dan OR of Red v Blue in Backgroundred.

Di sisi lain, regresi tanpa intersepsi dapat diprediksi hanya menghasilkan tiga peluang independen :

fit2 <- glm(Accepted~Background-1, data=dat, family="binomial")
exp(cbind(ODDS=coef(fit2), confint(fit2)))

                      ODDS     2.5 %    97.5 %
Backgroundblue   0.7441860 0.5367042 1.0265875
Backgroundorange 0.6461538 0.4354366 0.9484999
Backgroundred    1.2461538 0.9900426 1.5715814
Antoni Parellada
sumber
Selamat, Anda melakukan pekerjaan yang bagus untuk mencari tahu ini.
gung - Reinstate Monica