Memvisualisasikan hasil model campuran

15

Salah satu masalah yang selalu saya alami dengan model campuran adalah mencari tahu visualisasi data - dari jenis yang bisa berakhir di kertas atau poster - setelah seseorang mendapatkan hasilnya.

Saat ini, saya sedang mengerjakan model efek campuran Poisson dengan formula yang terlihat seperti berikut:

a <- glmer(counts ~ X + Y + Time + (Y + Time | Site) + offset(log(people))

Dengan sesuatu yang dipasang di glm () orang dapat dengan mudah menggunakan prediktif () untuk mendapatkan prediksi untuk kumpulan data baru, dan membangun sesuatu darinya. Tetapi dengan output seperti ini - bagaimana Anda membangun sesuatu seperti plot laju dari waktu ke waktu dengan pergeseran dari X (dan kemungkinan dengan nilai yang ditetapkan Y)? Saya pikir orang bisa memprediksi kecocokan dengan cukup baik hanya dari perkiraan efek tetap, tapi bagaimana dengan CI 95%?

Adakah hal lain yang dapat dipikirkan seseorang yang membantu memvisualisasikan hasil? Hasil model di bawah ini:

Random effects:
 Groups     Name        Variance   Std.Dev.  Corr          
 Site       (Intercept) 5.3678e-01 0.7326513               
            time        2.4173e-05 0.0049167  0.250        
            Y           4.9378e-05 0.0070270 -0.911  0.172 

Fixed effects:
              Estimate Std. Error z value Pr(>|z|)    
(Intercept) -8.1679391  0.1479849  -55.19  < 2e-16
X            0.4130639  0.1013899    4.07 4.62e-05
time         0.0009053  0.0012980    0.70    0.486    
Y            0.0187977  0.0023531    7.99 1.37e-15

Correlation of Fixed Effects:
         (Intr) Y    time
X      -0.178              
time    0.387 -0.305       
Y      -0.589  0.009  0.085
Fomite
sumber
1
(+1) @EpiGrad: Mengapa Anda khawatir tentang CI (yaitu tentang kesalahan standar) dari prediksi dari bagian efek-tetap dari model Anda?
boscovich
1
@andrea Jawaban intelektual, dan yang praktis: Secara intelektual, saya biasanya lebih suka mengukur dan memvisualisasikan ketidakpastian ketika saya bisa. Praktis, karena saya cukup yakin resensi akan memintanya.
Fomite
Yeah yeah, tentu, tapi maksudku sesuatu yang berbeda. Komentar saya tidak cukup jelas, maaf. Anda menulis di pertanyaan Anda "tetapi bagaimana dengan CI 95%?". Komentar saya adalah: mengapa Anda tidak menghitung kesalahan standar prediksi dari bagian efek-tetap dari model? Jika Anda dapat menghitung nilai prediksi dari bagian efek tetap, maka Anda juga bisa menghitung SE dan, dengan demikian, CI. @EpiGrad
boscovich
@andrea Ah. Kekhawatirannya adalah bahwa salah satu hal yang ingin saya prediksi, waktu, juga memiliki efek acak, yang saya tidak tahu harus melakukan apa.
Fomite
Ya, Anda ingin memprediksi counts, bukan time. Anda memperbaiki nilai X, Ydan timedan menggunakan bagian efek-tetap dari model yang Anda prediksi counts. Memang benar bahwa timetermasuk dalam model Anda juga sebagai efek acak (seperti intersep dan Y), tetapi tidak masalah di sini karena hanya menggunakan bagian efek-tetap dari model Anda untuk prediksi adalah seperti mengatur efek acak ke 0 @EpiGrad
boscovich

Jawaban:

4

Memprediksi countsmenggunakan bagian efek-tetap dari model Anda berarti bahwa Anda menetapkan ke nol (yaitu rata-rata) efek acak. Ini berarti bahwa Anda dapat "melupakan" tentang mereka dan menggunakan mesin standar untuk menghitung prediksi dan kesalahan standar dari prediksi (dengan mana Anda dapat menghitung interval kepercayaan).

Ini adalah contoh menggunakan Stata, tapi saya rasa ini dapat dengan mudah "diterjemahkan" ke dalam bahasa R:

webuse epilepsy, clear
xtmepoisson seizures treat visit || subject: visit
predict log_seiz, xb
gen pred_seiz = exp(log_seiz)
predict std_log_seiz, stdp
gen ub = exp(log_seiz+invnorm(.975)*std_log_seiz)
gen lb = exp(log_seiz-invnorm(.975)*std_log_seiz)

tw (line pred_seiz ub lb visit if treat == 0, sort lc(black black black) ///
 lp(l - -)), scheme(s1mono) legend(off) ytitle("Predicted Seizures") ///
 xtitle("Visit")

Grafik merujuk treat == 0dan dimaksudkan sebagai contoh ( visitbukan variabel yang benar-benar kontinu, tetapi hanya untuk mendapatkan ide). Garis putus-putus adalah interval kepercayaan 95%.

masukkan deskripsi gambar di sini

boscovich
sumber