Perbandingan model campuran efek yang diperbolehkan (terutama efek acak)

20

Saya telah melihat pemodelan efek campuran menggunakan paket lme4 di R. Saya terutama menggunakan lmerperintah jadi saya akan mengajukan pertanyaan saya melalui kode yang menggunakan sintaks itu. Saya kira pertanyaan umum yang mudah mungkin, apakah boleh untuk membandingkan dua model yang dibangun dalam lmermenggunakan rasio kemungkinan berdasarkan pada dataset identik? Saya percaya jawabannya pasti "tidak", tetapi saya bisa saja salah. Saya telah membaca informasi yang bertentangan tentang apakah efek acak harus sama atau tidak, dan komponen apa dari efek acak yang dimaksud? Jadi, saya akan memberikan beberapa contoh. Saya akan mengambil mereka dari data pengukuran berulang menggunakan kata stimuli, mungkin sesuatu seperti Baayen (2008) akan berguna dalam menafsirkan.

Katakanlah saya memiliki model di mana ada dua prediktor efek tetap, kita akan menyebutnya A, dan B, dan beberapa efek acak ... kata-kata dan subjek yang mempersepsikannya. Saya mungkin membangun model seperti berikut.

m <- lmer( y ~ A + B + (1|words) + (1|subjects) )

(perhatikan bahwa saya sengaja tidak masuk data =dan kami akan menganggap saya selalu bermaksud REML = FALSEdemi kejelasan)

Sekarang, dari model-model berikut, mana yang OK untuk dibandingkan dengan rasio kemungkinan terhadap yang di atas dan yang tidak?

m1 <- lmer( y ~ A + B + (A+B|words) + (1|subjects) )
m2 <- lmer( y ~ A + B + (1|subjects) )              
m3 <- lmer( y ~ A + B + (C|words) + (A+B|subjects) )
m4 <- lmer( y ~ A + B + (1|words) )                 
m5 <- lmer( y ~ A * B + (1|subjects) )   

Saya mengakui bahwa penafsiran beberapa perbedaan ini mungkin sulit, atau tidak mungkin. Tapi mari kita kesampingkan sebentar. Saya hanya ingin tahu apakah ada sesuatu yang mendasar dalam perubahan di sini yang menghalangi kemungkinan untuk membandingkan. Saya juga ingin tahu apakah, jika LR baik-baik saja, dan perbandingan AIC juga.

John
sumber
1
Terkait: stats.stackexchange.com/questions/117497 . Lihat juga bbolker.github.io/mixedmodels-misc/… .
Amuba mengatakan Reinstate Monica
(Saya perhatikan Anda telah menghapus tag [pengujian-hipotesis] yang saya tambahkan sebelumnya. Nah, terserah Anda, tetapi saya pikir itu tepat: uji rasio kemungkinan jelas merupakan prosedur pengujian hipotesis, dan [model campuran] + [pengujian hipotesis ] adalah IMHO kombinasi tag yang informatif, lihat stats.stackexchange.com/questions/tagged/… )
amoeba mengatakan Reinstate Monica
Diedit untuk menghapus "test" dari LR. LR dapat ditafsirkan tanpa tes dan membuatnya lebih paralel dengan AIC dan mengikuti maksud saya yang sebenarnya dengan lebih baik. Terima kasih telah menunjukkannya.
John

Jawaban:

13

Menggunakan kemungkinan maksimum, semua ini dapat dibandingkan dengan AIC; jika efek tetapnya sama ( m1dengan m4), menggunakan baik REML atau ML baik-baik saja, dengan REML biasanya lebih disukai, tetapi jika mereka berbeda, hanya ML yang dapat digunakan. Namun, interpretasi biasanya sulit ketika kedua efek tetap dan efek acak berubah, sehingga dalam praktiknya, sebagian besar merekomendasikan untuk mengubah satu atau yang lainnya sekaligus.

Menggunakan uji rasio kemungkinan adalah mungkin tetapi berantakan karena perkiraan chi-squared yang biasa tidak berlaku ketika menguji apakah komponen varians nol. Lihat jawaban Aniko untuk detailnya. (Kudos to Aniko untuk kedua membaca pertanyaan lebih hati-hati daripada saya dan membaca jawaban asli saya cukup hati-hati untuk memperhatikan bahwa itu merindukan titik ini. Terima kasih!)

Pinhiero / Bates adalah referensi klasik; itu menggambarkan nlmepaket, tetapi teorinya sama. Yah, sebagian besar sama; Doug Bates telah mengubah rekomendasinya tentang inferensi sejak menulis buku itu dan rekomendasi baru tercermin dalam lme4paket. Tapi itu lebih dari yang saya ingin masuk ke sini. Referensi yang lebih mudah dibaca adalah Weiss (2005), Modeling Longitudinal Data.

Aaron - Pasang kembali Monica
sumber
model m2 dan m4 atau m1 dan m3 tidak dapat dibandingkan dengan uji rasio kemungkinan. Mereka bukan model bersarang.
Makro
Ups, terima kasih sudah menangkapnya, @ Macro! Lihat edit.
Aaron - Reinstate Monica
Pertanyaannya hanya tentang membandingkan model ke model m, bukan satu sama lain. Namun demikian, apakah Anda mengatakan bahwa perbandingan AIC dapat dibuat bahkan ketika tidak disarangkan? Jawaban atas pertanyaan ini tampaknya bertentangan dengan itu.
John
@ John, saya membaca jawaban itu tetapi tidak tahu di mana ia membahas AIC dan bukan-bersarang. Saya cukup yakin itu baik-baik saja, tetapi dapatkah Anda memberi saya petunjuk yang lebih tepat untuk titik itu dalam jawaban?
Aaron - Reinstate Monica
Saya menurunkan jawaban, karena Anda salah (atau paling tidak menyesatkan) tentang penerapan tes rasio kemungkinan.
Aniko
12

mmm4σ2=0

mm212χ12+12χ02χ12

Namun, seperti yang dinyatakan @ Harun, banyak ahli tidak merekomendasikan melakukan tes rasio kemungkinan seperti ini. Alternatif potensial adalah kriteria informasi (AIC, BIC, dll), atau bootstrap LRT.

[1] Self, SG & Liang, K. Sifat asimptotik dari penduga kemungkinan maksimum dan uji rasio kemungkinan di bawah kondisi tidak standar J. Amer. Statist. Assoc., 1987, 82, 605-610.

Aniko
sumber
1
Terima kasih atas info LR. Saya belum benar-benar memikirkan masalah batas LR ketika membuat model sebagai contoh. Saya hanya memperhatikan bahwa jawaban Anda tidak jelas apakah rekomendasi Anda berlaku untuk kasus-kasus sederhana seperti hanya membandingkan model dengan efek tetap yang berbeda (tentu saja perkiraan ML).
John
Tidak, masalah ini hanya muncul saat menguji komponen varians, bukan efek tetap.
Aaron - Pasang kembali Monica