Apa yang mudah ditafsirkan, langkah-langkah good of fit untuk model efek campuran linier?

37

Saya saat ini menggunakan paket R lme4 .

Saya menggunakan model efek campuran linier dengan efek acak:

library(lme4)
mod1 <- lmer(r1 ~ (1 | site), data = sample_set) #Only random effects
mod2 <- lmer(r1 ~ p1 + (1 | site), data = sample_set) #One fixed effect + 
            # random effects
mod3 <- lmer(r1 ~ p1 + p2 + (1 | site), data = sample_set) #Two fixed effects + 
            # random effects

Untuk membandingkan model, saya menggunakan anovafungsi dan melihat perbedaan dalam AIC relatif terhadap model AIC terendah:

anova(mod1, mod2, mod3)

Di atas baik untuk membandingkan model.

Namun, saya juga memerlukan beberapa cara sederhana untuk menginterpretasikan ukuran goodness of fit untuk masing-masing model. Adakah yang punya pengalaman dengan tindakan seperti itu? Saya telah melakukan beberapa penelitian, dan ada makalah jurnal tentang R kuadrat untuk efek tetap model efek campuran:

  • Cheng, J., Edwards, LJ, Maldonado-Molina, MM, Komro, KA, & Muller, KE (2010). Analisis data longitudinal nyata untuk orang sungguhan: Membangun model campuran yang cukup baik. Statistik dalam Kedokteran, 29 (4), 504-520. doi: 10.1002 / sim.3775
  • Edwards, LJ, Muller, KE, Wolfinger, RD, Qaqish, BF, & Schabenberger, O. (2008). Statistik R2 untuk efek tetap dalam model campuran linier. Statistik dalam Kedokteran, 27 (29), 6137-6157. doi: 10.1002 / sim.3429

Namun tampaknya, ada beberapa kritik seputar penggunaan tindakan seperti yang diusulkan dalam makalah di atas.

Bisakah seseorang menyarankan beberapa langkah mudah untuk ditafsirkan, good of of fit yang dapat diterapkan pada model saya?

mjburns
sumber
2
Saya sangat suka pertanyaannya, tetapi menggunakan tes rasio kemungkinan untuk menentukan apakah efek tetap diperlukan atau tidak bukan strategi yang direkomendasikan, lihat faq . Jadi hal di atas tidak baik untuk membandingkan model.
Henrik
Terima kasih, Henrik. FAQ yang Anda daftarkan sangat membantu. Kedengarannya seperti rantai Markov sampel Monte Carlo bisa menjadi strategi yang baik untuk membandingkan model saya.
mjburns
1
Masalah dengan MCMC adalah Anda hanya dapat memiliki efek acak sederhana (seperti pada contoh Anda). Saya akan pergi dengan pendekatan kenward-rogers ke derajat kebebasan karena ini juga berlaku untuk model yang lebih rumit. Lihat fungsinya mixed()dalam paket afex saya ( versi pengembangan juga memiliki bootstrap parametrik ). Lihat sini untuk beberapa referensi .
Henrik
OK Henrik. Saya berhasil membuat fungsi mixed () Anda bekerja dari paket afex. Bisakah Anda memberi saran tentang bagaimana saya bisa menggunakan afex untuk membandingkan model? Apa ukuran yang bisa saya gunakan untuk memutuskan apakah satu model lebih masuk akal daripada yang lain? Terima kasih.
mjburns
Ini tidak mudah dijawab, mungkin Anda mengajukan pertanyaan terpisah yang memberikan rincian lebih lanjut. Tetapi secara singkat, afex mencoba membantu Anda menilai apakah efek tertentu (atau model yang lebih baik termasuk efek ini) signifikan. Untuk tujuan ini digunakan KRmodcompdari paket pbkrtest. Anda juga dapat menggunakan KRmodcomplangsung untuk membandingkan model.
Henrik

Jawaban:

3

Tidak ada yang mudah untuk mengartikan ukuran goodness of fit untuk model campuran linier :)

Random effect fit (mod1) dapat diukur dengan ICCdan ICC2(rasio antara varians dicatat oleh efek acak dan varians residual). paket psychometric R mencakup fungsi untuk mengekstraknya dari objek lme.

Dimungkinkan untuk menggunakan R2untuk menilai efek tetap (mod2, mod3), tetapi ini bisa rumit: Ketika dua model menunjukkan R2 yang sama, itu bisa menjadi kasus yang satu lebih "akurat", tetapi itu ditutupi oleh faktor tetapnya " mengurangi "komponen varians yang lebih besar ke efek acak. Di sisi lain mudah untuk menafsirkan R2 yang lebih besar dari model orde tertinggi (misalnya mod3). Dalam bab Baayen tentang model campuran ada diskusi bagus tentang ini. Juga, tutorialnya sangat jelas.

Solusi yang mungkin adalah mempertimbangkan masing-masing variance componentsecara independen, dan kemudian menggunakannya untuk membandingkan model.

ajeje
sumber
1
Bisakah Anda memberi tahu kami apa referensi yang Anda maksud ketika Anda mengatakan bab Baayen?
KH Kim
ya, referensi rusak!
Penasaran
Saya telah menemukan kutipan ini, tidak yakin apakah itu, tetapi tidak bisa mendapatkan PDF di mana saja: BaayenR. H., Menganalisis data linguistik: Pengantar praktis untuk statistik menggunakan R. Cambridge: Cambridge University Press, 2008. Pp. 368. ISBN-13: 978-0-521-70918-7. - Volume 37 Edisi 2 - Grzegorz Krajewski, Danielle Matthews
Penasaran
1
Ayolah teman-teman. Di mana google-foo Anda? Lakukan pencarian di "baayenCUPstats.pdf: hit pertama: sfs.uni-tuebingen.de/ ~ hbaayen
publications