Saya memiliki model bertahan hidup dengan pasien bersarang di rumah sakit yang mencakup efek acak untuk rumah sakit. Efek acak terdistribusi gamma, dan saya mencoba melaporkan 'relevansi' istilah ini pada skala yang mudah dipahami.
Saya telah menemukan referensi berikut yang menggunakan Rasio Bahaya Median (sedikit seperti Rasio Peluang Median), dan menghitung ini.
Bengtsson T, Dribe M: Metode Sejarah 43:15, 2010
Namun, sekarang saya ingin melaporkan ketidakpastian terkait dengan perkiraan ini menggunakan bootstrap. Data tersebut adalah data kelangsungan hidup, dan karenanya ada beberapa pengamatan per pasien, dan beberapa pasien per rumah sakit. Tampak jelas bahwa saya perlu mengelompokkan pengamatan pasien saat pengambilan sampel ulang. Tetapi saya tidak tahu apakah saya harus mengelompokkan rumah sakit juga (mis. Sampel rumah sakit, bukan pasien?
Saya bertanya-tanya apakah jawabannya tergantung pada parameter minat, dan apakah akan berbeda jika targetnya adalah sesuatu yang relevan di tingkat pasien daripada tingkat rumah sakit?
Saya telah mencantumkan kode stata di bawah untuk berjaga-jaga.
cap program drop est_mhr
program define est_mhr, rclass
stcox patient_var1 patient_var2 ///
, shared(hospital) ///
noshow
local twoinvtheta2 = 2 / (e(theta)^2)
local mhr = exp(sqrt(2*e(theta))*invF(`twoinvtheta2',`twoinvtheta2',0.75))
return scalar mhr = `mhr'
end
bootstrap r(mhr), reps(50) cluster(hospital): est_mhr
sumber
Jawabannya tampaknya proses resampling perlu memperhitungkan struktur data. Ada penjelasan yang bagus di sini (bersama dengan beberapa kode R untuk mengimplementasikan ini).
http://biostat.mc.vanderbilt.edu/wiki/Main/HowToBootstrapCorrelatedData
Berkat pointer dari Kelompok Konsultasi Statistik UCLA .
Saya telah menulis versi potongan kode yang lebih cepat (tetapi kurang fleksibel) yang ditautkan ke atas - periksa di sini untuk pembaruan dan perincian.
sumber