Menghitung rasio risiko menggunakan rasio odds dari koefisien regresi logistik

8

Saya memiliki regresi logistik biner dengan hanya satu prediktor faktor tetap biner. Alasan saya tidak melakukannya sebagai Chi square atau tes Fisher adalah karena saya juga memiliki sejumlah faktor acak (ada beberapa titik data per individu dan individu dalam kelompok, meskipun saya tidak peduli dengan koefisien atau signifikansi untuk variabel-variabel acak). Saya melakukan ini dengan R glmer.

Saya ingin dapat mengekspresikan koefisien dan interval kepercayaan yang terkait untuk prediktor sebagai rasio risiko daripada rasio peluang. Ini karena (mungkin bukan untuk Anda tetapi untuk audiens saya) rasio risiko jauh lebih mudah dipahami. Rasio risiko di sini adalah peningkatan relatif dalam kemungkinan hasil menjadi 1 daripada 0 jika prediktornya 1 daripada 0.

Rasio odds sepele untuk mendapatkan dari koefisien dan CI terkait menggunakan exp (). Untuk mengonversi rasio peluang menjadi rasio risiko, Anda dapat menggunakan "RR = OR / (1 - p + (px OR)), di mana p adalah risiko dalam kelompok kontrol" (sumber: http: //www.r- bloggers.com/how-to-convert-odds-ratios-to-relative-risks/). Tapi, Anda perlu risiko pada kelompok kontrol, yang dalam kasus saya berarti kemungkinan hasilnya adalah 1 jika prediktornya adalah 0. Saya percaya koefisien intersep dari model sebenarnya adalah peluang untuk peluang ini, jadi saya bisa menggunakan prob = odds / (odds +1) untuk mendapatkannya. Saya cukup jauh sejauh ini, sejauh estimasi pusat untuk rasio risiko berlaku. Tetapi yang membuat saya khawatir adalah interval kepercayaan yang terkait, karena koefisien intersepsi juga memiliki CI terkait sendiri. Haruskah saya menggunakan estimasi pusat intersep, atau menjadi konservatif haruskah saya menggunakan batasan CI intersep apa pun yang membuat CI relatif berisiko terbesar? Atau apakah saya menggonggong pohon yang salah sepenuhnya?

Amorphia
sumber
Kemungkinan duplikat dari Regresi Logistik dalam R (Odds Ratio)
Minnow
Ini sama sekali bukan duplikat dari pertanyaan itu. Saya tidak punya masalah mendapatkan odds rasio, itu adalah rasio risiko yang saya pikirkan. Mereka tidak disebutkan dalam pertanyaan itu.
Amorphia

Jawaban:

5

Zhang 1998 awalnya menyajikan metode untuk menghitung CI untuk rasio risiko yang menunjukkan Anda bisa menggunakan batas bawah dan atas CI untuk rasio odds.

Metode ini tidak berhasil, bias dan umumnya menghasilkan perkiraan antikonservatif (terlalu ketat) dari rasio risiko 95% CI. Ini karena korelasi antara istilah intersep dan istilah kemiringan yang Anda singgung dengan benar. Jika rasio odds cenderung ke nilai yang lebih rendah di CI, istilah intersepsi meningkat untuk memperhitungkan prevalensi keseluruhan yang lebih tinggi pada mereka yang memiliki tingkat paparan 0 dan sebaliknya untuk nilai yang lebih tinggi di CI. Masing-masing dari masing-masing mengarah ke batas yang lebih rendah dan lebih tinggi untuk CI.

Untuk menjawab pertanyaan Anda secara langsung, Anda perlu pengetahuan tentang prevalensi dasar dari hasil untuk mendapatkan interval kepercayaan yang benar. Data dari studi kasus kontrol akan bergantung pada data lain untuk menginformasikan hal ini.

Sebagai alternatif, Anda dapat menggunakan metode delta jika Anda memiliki struktur kovarian penuh untuk estimasi parameter. Parameterisasi setara untuk transformasi OR ke RR (memiliki paparan biner dan satu prediktor tunggal) adalah:

RR=1+exp(-β0)1+exp(-β0-β1)

Dan menggunakan metode delta multivarian, dan teorema batas pusat yang menyatakan bahwa , Anda dapat memperoleh varian perkiraan distribusi normal .n([β^0,β^1]-[β0,β1])DN(0,saya-1(β))RR

Catatan, notasi ini hanya berfungsi untuk paparan biner dan regresi logistik univariat. Ada beberapa trik R sederhana yang menggunakan metode delta dan standardisasi marginal untuk kovariat kontinu dan variabel penyesuaian lainnya. Tetapi untuk singkatnya saya tidak akan membahasnya di sini.

Namun, ada beberapa cara untuk menghitung risiko relatif dan kesalahan standarnya langsung dari model dalam R. Dua contoh di bawah ini:

x <- sample(0:1, 100, replace=T)
y <- rbinom(100, 1, x*.2+.2)
glm(y ~ x, family=binomial(link=log))
library(survival)
coxph(Surv(time=rep(1,100), event=y) ~ x)

http://research.labiomed.org/Biostat/Education/Case%20Studies%202005/Session4/ZhangYu.pdf

AdamO
sumber
AdamO, jawaban Anda adalah yang paling dekat dengan apa yang saya cari. Bisakah Anda mengarahkan saya ke arah mendapatkan RR dari ATAU dari model multistari multivariabel?
altfi_SU
@altfi_SU Saya menerapkan ini dalam paket epitools sebagai probratio. Catatan kontak sangat kedaluwarsa :( rdrr.io/cran/epitools/man/probratio.html
AdamO
Terima kasih, @AdamO. Senang mengetahui paket ini ada. Namun, saya bekerja dengan hasil yang dipublikasikan dari model multivariabel dan karena itu tidak dapat melewatkan glmobjek sebagai argumen ke probratiofungsi. Saya perlu menemukan RR dalam meta-analisis. Adakah petunjuk dalam bentuk notasi matematika seperti yang Anda tulis di atas?
altfi_SU