Saya telah melihat pemodelan efek campuran menggunakan paket lme4 di R. Saya terutama menggunakan lmer
perintah jadi saya akan mengajukan pertanyaan saya melalui kode yang menggunakan sintaks itu. Saya kira pertanyaan umum yang mudah mungkin, apakah boleh untuk membandingkan dua model yang dibangun dalam lmer
menggunakan rasio kemungkinan berdasarkan pada dataset identik? Saya percaya jawabannya pasti "tidak", tetapi saya bisa saja salah. Saya telah membaca informasi yang bertentangan tentang apakah efek acak harus sama atau tidak, dan komponen apa dari efek acak yang dimaksud? Jadi, saya akan memberikan beberapa contoh. Saya akan mengambil mereka dari data pengukuran berulang menggunakan kata stimuli, mungkin sesuatu seperti Baayen (2008) akan berguna dalam menafsirkan.
Katakanlah saya memiliki model di mana ada dua prediktor efek tetap, kita akan menyebutnya A, dan B, dan beberapa efek acak ... kata-kata dan subjek yang mempersepsikannya. Saya mungkin membangun model seperti berikut.
m <- lmer( y ~ A + B + (1|words) + (1|subjects) )
(perhatikan bahwa saya sengaja tidak masuk data =
dan kami akan menganggap saya selalu bermaksud REML = FALSE
demi kejelasan)
Sekarang, dari model-model berikut, mana yang OK untuk dibandingkan dengan rasio kemungkinan terhadap yang di atas dan yang tidak?
m1 <- lmer( y ~ A + B + (A+B|words) + (1|subjects) )
m2 <- lmer( y ~ A + B + (1|subjects) )
m3 <- lmer( y ~ A + B + (C|words) + (A+B|subjects) )
m4 <- lmer( y ~ A + B + (1|words) )
m5 <- lmer( y ~ A * B + (1|subjects) )
Saya mengakui bahwa penafsiran beberapa perbedaan ini mungkin sulit, atau tidak mungkin. Tapi mari kita kesampingkan sebentar. Saya hanya ingin tahu apakah ada sesuatu yang mendasar dalam perubahan di sini yang menghalangi kemungkinan untuk membandingkan. Saya juga ingin tahu apakah, jika LR baik-baik saja, dan perbandingan AIC juga.
Jawaban:
Menggunakan kemungkinan maksimum, semua ini dapat dibandingkan dengan AIC; jika efek tetapnya sama (
m1
denganm4
), menggunakan baik REML atau ML baik-baik saja, dengan REML biasanya lebih disukai, tetapi jika mereka berbeda, hanya ML yang dapat digunakan. Namun, interpretasi biasanya sulit ketika kedua efek tetap dan efek acak berubah, sehingga dalam praktiknya, sebagian besar merekomendasikan untuk mengubah satu atau yang lainnya sekaligus.Menggunakan uji rasio kemungkinan adalah mungkin tetapi berantakan karena perkiraan chi-squared yang biasa tidak berlaku ketika menguji apakah komponen varians nol. Lihat jawaban Aniko untuk detailnya. (Kudos to Aniko untuk kedua membaca pertanyaan lebih hati-hati daripada saya dan membaca jawaban asli saya cukup hati-hati untuk memperhatikan bahwa itu merindukan titik ini. Terima kasih!)
Pinhiero / Bates adalah referensi klasik; itu menggambarkan
nlme
paket, tetapi teorinya sama. Yah, sebagian besar sama; Doug Bates telah mengubah rekomendasinya tentang inferensi sejak menulis buku itu dan rekomendasi baru tercermin dalamlme4
paket. Tapi itu lebih dari yang saya ingin masuk ke sini. Referensi yang lebih mudah dibaca adalah Weiss (2005), Modeling Longitudinal Data.sumber
m
m
m4
m
m2
Namun, seperti yang dinyatakan @ Harun, banyak ahli tidak merekomendasikan melakukan tes rasio kemungkinan seperti ini. Alternatif potensial adalah kriteria informasi (AIC, BIC, dll), atau bootstrap LRT.
[1] Self, SG & Liang, K. Sifat asimptotik dari penduga kemungkinan maksimum dan uji rasio kemungkinan di bawah kondisi tidak standar J. Amer. Statist. Assoc., 1987, 82, 605-610.
sumber