Bagaimana cara menginterpretasikan varian efek acak dalam model campuran linier umum

9

Dalam Model Generalized Linear Mixed logistik (family = binomial), saya tidak tahu bagaimana menafsirkan varians efek acak:

Random effects:
 Groups   Name        Variance Std.Dev.
 HOSPITAL (Intercept) 0.4295   0.6554  
Number of obs: 2275, groups: HOSPITAL, 14

Bagaimana cara menginterpretasikan hasil numerik ini?

Saya memiliki sampel pasien yang ditransplantasikan ginjal dalam penelitian multicenter. Saya sedang menguji apakah kemungkinan seorang pasien dirawat dengan perawatan antihipertensi spesifik adalah sama di antara pusat. Proporsi pasien yang dirawat sangat bervariasi antara pusat, tetapi mungkin disebabkan oleh perbedaan karakteristik basal pasien. Jadi saya memperkirakan model campuran linier umum (logistik), menyesuaikan fitur-fitur utama dari para pasien. Ini hasilnya:

Generalized linear mixed model fit by maximum likelihood ['glmerMod']
 Family: binomial ( logit )
Formula: HTATTO ~ AGE + SEX + BMI + INMUNOTTO + log(SCR) + log(PROTEINUR) + (1 | CENTER) 
   Data: DATOS 

     AIC      BIC   logLik deviance 
1815.888 1867.456 -898.944 1797.888 

Random effects:
 Groups   Name        Variance Std.Dev.
 CENTER (Intercept) 0.4295   0.6554  
Number of obs: 2275, groups: HOSPITAL, 14

Fixed effects:
                           Estimate Std. Error z value Pr(>|z|)    
(Intercept)               -1.804469   0.216661  -8.329  < 2e-16 ***
AGE                       -0.007282   0.004773  -1.526  0.12712    
SEXFemale                 -0.127849   0.134732  -0.949  0.34267    
BMI                        0.015358   0.014521   1.058  0.29021    
INMUNOTTOB                 0.031134   0.142988   0.218  0.82763    
INMUNOTTOC                -0.152468   0.317454  -0.480  0.63102    
log(SCR)                   0.001744   0.195482   0.009  0.99288    
log(PROTEINUR)             0.253084   0.088111   2.872  0.00407 ** 

Variabel kuantitatif terpusat. Saya tahu bahwa standar deviasi intersep di antara rumah sakit adalah 0,6554, dalam skala log-odds. Karena intersep adalah -1,804469, dalam skala log-odds, maka kemungkinan diperlakukan dengan antihipertensi pria, usia rata-rata, dengan nilai rata-rata di semua variabel dan perlakuan inmuno A, untuk pusat "rata-rata", adalah 14,1% . Dan sekarang mulai interpretasi: dengan asumsi bahwa efek acak mengikuti distribusi normal, kita akan mengharapkan sekitar 95% pusat memiliki nilai dalam 2 standar deviasi dari rata-rata nol, sehingga kemungkinan diperlakukan untuk rata-rata manusia. akan bervariasi antara pusat dengan interval jangkauan:

exp(-1.804469-2*0.6554)/(1+exp(-1.804469-2*0.6554))

exp(-1.804469+2*0.6554)/(1+exp(-1.804469+2*0.6554))

Apakah ini benar?

Juga, bagaimana saya bisa menguji glmer jika variabilitas antara pusat secara statistik signifikan? Saya dulu bekerja dengan MIXNO, perangkat lunak yang sangat baik dari Donald Hedeker, dan di sana saya memiliki kesalahan standar dari varian estimasi, yang tidak saya miliki dalam glmer. Bagaimana saya dapat memiliki kemungkinan dirawat untuk pria "rata-rata" di setiap pusat, dengan interval kepercayaan?

Terima kasih

pengguna2310909
sumber

Jawaban:

10

Mungkin paling membantu jika Anda menunjukkan kepada kami informasi lebih lanjut tentang model Anda, tetapi: nilai dasar dari log-odds dari apa pun respons Anda (misalnya kematian) bervariasi di setiap rumah sakit. Nilai dasar (istilah intersepsi per-rumah sakit) adalah peluang log mortalitas (atau apa pun) dalam kategori dasar (misalnya "tidak diobati"), dengan nilai nol dari setiap prediktor berkelanjutan. Variasi itu diasumsikan terdistribusi secara normal, pada skala log-odds. Simpangan baku intersep antar rumah sakit adalah 0,6554; varians (hanya deviasi standar kuadrat - bukan ukuran ketidakpastian deviasi standar) adalah .0,65542=0,4295

(Jika Anda mengklarifikasi pertanyaan Anda / menambahkan lebih detail tentang model Anda, saya dapat mencoba untuk mengatakan lebih banyak.)

perbarui : interpretasi Anda tentang variasi tampaknya benar. Lebih tepatnya,

cc <- fixef(fitted_model)[1] ## intercept
ss <- sqrt(unlist(VarCorr(fitted_model))) ## random effects SD
plogis(qnorm(c(0.025,0.975),mean=cc,sd=ss))

harus memberi Anda interval 95% (tidak benar-benar cukup interval kepercayaan, tetapi sangat mirip) untuk probabilitas baseline (pria / usia rata-rata / dll.) individu dirawat di rumah sakit.

Untuk menguji signifikansi efek acak, Anda memiliki beragam pilihan (lihat http://bbolker.github.io/mixedmodels-misc/glmmFAQ.html untuk informasi lebih lanjut). (Perhatikan bahwa kesalahan standar varian RE biasanya bukan cara yang dapat diandalkan untuk menguji signifikansi, karena distribusi sampling sering miring / non-Normal.) Pendekatan paling sederhana adalah dengan melakukan uji rasio kemungkinan, misalnya

pchisq(2*(logLik(fitted_model)-logLik(fitted_model_without_RE)),
       df=1,lower.tail=FALSE)/2

Pembagian akhir oleh 2 mengoreksi fakta bahwa uji rasio kemungkinan konservatif ketika nilai nol (yaitu varians RE = 0) berada pada batas ruang yang layak (mis. Varians RE tidak dapat <0).

Ben Bolker
sumber
Saya mengedit pertanyaan
user2310909
1
Terima kasih, senang membaca kepada seseorang yang tahu benar tentang masalah ini.
user2310909