Saya tertarik untuk memperkirakan rasio risiko yang disesuaikan, analog dengan bagaimana seseorang memperkirakan rasio odds yang disesuaikan menggunakan regresi logistik. Beberapa literatur (misalnya, ini ) menunjukkan bahwa menggunakan regresi Poisson dengan kesalahan standar Huber-White adalah cara berbasis model untuk melakukan ini
Saya belum menemukan literatur tentang bagaimana penyesuaian untuk kovariat berkelanjutan mempengaruhi hal ini. Simulasi sederhana berikut menunjukkan bahwa masalah ini tidak mudah:
arr <- function(BLR,RR,p,n,nr,ce)
{
B = rep(0,nr)
for(i in 1:nr){
b <- runif(n)<p
x <- rnorm(n)
pr <- exp( log(BLR) + log(RR)*b + ce*x)
y <- runif(n)<pr
model <- glm(y ~ b + x, family=poisson)
B[i] <- coef(model)[2]
}
return( mean( exp(B), na.rm=TRUE ) )
}
set.seed(1234)
arr(.3, 2, .5, 200, 100, 0)
[1] 1.992103
arr(.3, 2, .5, 200, 100, .1)
[1] 1.980366
arr(.3, 2, .5, 200, 100, 1)
[1] 1.566326
Dalam hal ini, rasio risiko sebenarnya adalah 2, yang pulih dengan andal ketika efek kovariat kecil. Tetapi, ketika efek kovariat besar, ini terdistorsi. Saya berasumsi ini muncul karena efek kovariat dapat mendorong ke atas terhadap batas atas (1) dan ini mencemari estimasi.
Saya telah melihat tetapi belum menemukan literatur tentang penyesuaian untuk kovariat berkesinambungan dalam estimasi rasio risiko yang disesuaikan. Saya mengetahui posting berikut di situs ini:
- Regresi Poisson untuk memperkirakan risiko relatif untuk hasil biner
- Regresi Poisson untuk data biner
tetapi mereka tidak menjawab pertanyaan saya. Apakah ada makalah tentang ini? Apakah ada peringatan yang diketahui yang harus dilakukan?
sumber
Jawaban:
Saya tidak tahu apakah Anda masih membutuhkan jawaban untuk pertanyaan ini, tetapi saya memiliki masalah serupa di mana saya ingin menggunakan regresi Poisson. Dalam menjalankan kode Anda, saya menemukan bahwa jika saya mengatur model sebagai
alih-alih sebagai model regresi Poisson Anda, hasil yang sama terjadi: perkiraan OR adalah ~ 1,5 ketika ce mendekati 1. Jadi, saya tidak yakin bahwa contoh Anda memberikan informasi tentang kemungkinan masalah dengan penggunaan regresi Poisson untuk hasil biner.
sumber
binomial(link=log)
untuk benar-benar cocok dengan model risiko relatif, tetapi jarang konvergen karena hasil yang terlalu tinggi.Saya menemukan bahwa menggunakan kemungkinan maksimum langsung dengan fungsi probabilitas yang tepat sangat meningkatkan estimasi risiko relatif. Anda dapat secara langsung menentukan fungsi risiko terpotong sebagai tingkat prediksi untuk proses tersebut.
Biasanya kami menggunakan Hessian untuk membuat CI untuk estimasi. Saya belum mengeksplorasi kemungkinan menggunakannya sebagai matriks "B" (daging) dalam kesalahan Huber White dan menggunakan risiko yang dipasang untuk mendapatkan matriks "A" (roti) ... tapi saya menduga itu bisa bekerja! Lebih layaknya Anda dapat menggunakan bootstrap untuk mendapatkan kesalahan model yang kuat untuk hubungan mean-variance yang salah ditentukan.
Memberi:
Koefisien tengah memberi Anda apa yang Anda inginkan.
sumber