Saya menjalankan regresi linear penerimaan ke perguruan tinggi terhadap nilai SAT dan latar belakang keluarga / etnis. Datanya fiksi. Ini adalah tindak lanjut dari pertanyaan sebelumnya, sudah dijawab. Pertanyaannya berfokus pada pengumpulan dan interpretasi rasio odds ketika meninggalkan skor SAT untuk kesederhanaan.
Variabelnya adalah Accepted
(0 atau 1) dan Background
("merah" atau "biru"). Saya mengatur data sehingga orang-orang dengan latar belakang "merah" lebih mungkin untuk masuk:
fit <- glm(Accepted~Background, data=dat, family="binomial")
exp(cbind(Odds_Ratio_RedvBlue=coef(fit), confint(fit)))
Odds_Ratio_RedvBlue 2.5 % 97.5 %
(Intercept) 0.7088608 0.5553459 0.9017961
Backgroundred 2.4480042 1.7397640 3.4595454
Pertanyaan:
Apakah 0,7 rasio aneh seseorang dengan latar belakang "biru" diterima? Saya menanyakan ini karena saya juga mendapatkan 0,7 untuk "
Backgroundblue
" jika saya menjalankan kode berikut:fit <- glm(Accepted~Background-1, data=dat, family="binomial") exp(cbind(OR=coef(fit), confint(fit)))
r
regression
logistic
Antoni Parellada
sumber
sumber
R
secara eksplisit menyebut koefisien (melalui fungsicoef
) yang Anda panggil "odds ratio" di output Anda. Itu menunjukkan Anda mungkin ingin meninjau perbedaan antara keduanya.Jawaban:
Saya telah berupaya menjawab pertanyaan saya dengan menghitung rasio odds dan odds secara manual:
Jadi Odds Ratio untuk masuk ke sekolah Red over Blue adalah:
Dan ini adalah
Backgroundred
kembalinya:Pada saat yang sama,112 / 158 = 0,7089
(Intercept)
sesuai dengan pembilang dariJika sebaliknya, saya jalankan:
Pengembaliannya justru peluang menjadi 'biru':
Backgroundblue
(0,7089) dan peluang diterima menjadi 'merah':Backgroundred
(1,7353). Tidak ada Rasio Peluang di sana. Oleh karena itu dua nilai kembali tidak diharapkan bersifat timbal balik.Akhirnya, Bagaimana cara membaca hasil jika ada 3 faktor dalam kategori regressor?
Penghitungan manual yang sama dengan [R]:
Saya membuat set data fiktif yang berbeda dengan premis yang sama, tetapi kali ini ada tiga latar belakang etnis: "merah", "biru" dan "oranye", dan menjalankan urutan yang sama:
Pertama, tabel kontingensi:
Dan menghitung Peluang masuk untuk setiap kelompok etnis:
Serta berbeda Rasio Odds yang :
Dan dilanjutkan dengan regresi logistik rutin yang sekarang diikuti oleh eksponen koefisien:
Menghasilkan peluang masuk untuk "blues" sebagai
(Intercept)
, dan Odds Ratios of Orange versus Blue inBackgroundorange
, dan OR of Red v Blue inBackgroundred
.Di sisi lain, regresi tanpa intersepsi dapat diprediksi hanya menghasilkan tiga peluang independen :
sumber