Saya menjalankan desain berulang dimana saya menguji 30 pria dan 30 wanita di tiga tugas yang berbeda. Saya ingin memahami bagaimana perilaku pria dan wanita berbeda dan bagaimana itu tergantung pada tugas. Saya menggunakan paket lmer dan lme4 untuk menyelidiki ini, namun, saya terjebak dengan mencoba memeriksa asumsi untuk kedua metode. Kode yang saya jalankan adalah
lm.full <- lmer(behaviour ~ task*sex + (1|ID/task), REML=FALSE, data=dat)
lm.full2 <-lme(behaviour ~ task*sex, random = ~ 1|ID/task, method="ML", data=dat)
Saya memeriksa apakah interaksi tersebut adalah model terbaik dengan membandingkannya dengan model yang lebih sederhana tanpa interaksi dan menjalankan anova:
lm.base1 <- lmer(behaviour ~ task+sex+(1|ID/task), REML=FALSE, data=dat)
lm.base2 <- lme(behaviour ~ task+sex, random= ~1|ID/task), method="ML", data=dat)
anova(lm.base1, lm.full)
anova(lm.base2, lm.full2)
T1: Apakah boleh menggunakan prediktor kategori ini dalam model campuran linier?
T2: Apakah saya mengerti dengan benar tidak apa-apa variabel hasil ("perilaku") tidak perlu didistribusikan secara normal sendiri (lintas jenis kelamin / tugas)?
T3: Bagaimana saya bisa memeriksa homogenitas varians? Untuk model linier sederhana saya gunakan plot(LM$fitted.values,rstandard(LM))
. Apakah menggunakan plot(reside(lm.base1))
cukup?
Q4: Untuk memeriksa normalitas menggunakan kode berikut, ok?
hist((resid(lm.base1) - mean(resid(lm.base1))) / sd(resid(lm.base1)), freq = FALSE); curve(dnorm, add = TRUE)
sumber
Jawaban:
T1: Ya - sama seperti model regresi mana pun.
T2: Sama seperti model linear umum, variabel hasil Anda tidak perlu didistribusikan secara normal sebagai variabel univariat. Namun, model LME mengasumsikan bahwa residual dari model terdistribusi secara normal. Jadi transformasi atau penambahan bobot pada model akan menjadi cara untuk mengurus hal ini (dan tentu saja memeriksa dengan plot diagnostik).
Q3:
plot(myModel.lme)
Q4:
qqnorm(myModel.lme, ~ranef(., level=2))
. Kode ini akan memungkinkan Anda membuat plot QQ untuk setiap tingkat efek acak. Model-model LME mengasumsikan bahwa tidak hanya residu dalam-kluster yang terdistribusi secara normal, tetapi juga setiap level efek acak. Variasikanlevel
dari 0, 1, hingga 2 sehingga Anda dapat memeriksa tikus, tugas, dan residu dalam subjek.EDIT: Saya juga harus menambahkan bahwa sementara normalitas diasumsikan dan transformasi yang mungkin membantu mengurangi masalah dengan kesalahan / efek acak yang tidak normal, tidak jelas bahwa semua masalah sebenarnya diselesaikan atau bias tidak diperkenalkan. Jika data Anda memerlukan transformasi, maka berhati-hatilah dengan perkiraan efek acak. Ini makalah yang membahas ini .
sumber
Anda tampaknya cukup menyesatkan tentang asumsi seputar model multi-level. Tidak ada asumsi homogenitas varians dalam data, hanya saja residu seharusnya terdistribusi secara normal. Dan prediktor kategoris digunakan dalam regresi sepanjang waktu (fungsi yang mendasari dalam R yang menjalankan ANOVA adalah perintah regresi linier).
Untuk perincian tentang memeriksa asumsi, lihat buku Pinheiro dan Bates (hlm. 174, bagian 4.3.1). Juga, jika Anda berencana untuk menggunakan lme4 (yang tidak dituliskan oleh buku), Anda dapat mereplikasi plotnya menggunakan plot dengan
lmer
model (?plot.merMod
).Untuk memeriksa normalitas dengan cepat, itu hanya akan terjadi
qqnorm(resid(myModel))
.sumber
Tentang Q2:
Menurut Pinheiro dan Bates' buku Anda dapat menggunakan pendekatan sebagai berikut:
Jika Anda ingin memeriksa varians yang sama antara
sex
Anda dapat menggunakan pendekatan ini:Jika varians berbeda, Anda dapat memperbarui model Anda dengan cara berikut:
Lebih jauh lagi, Anda mungkin melihat
robustlmm
paket yang juga menggunakan pendekatan penimbangan. Tesis PhD Koller tentang konsep ini tersedia sebagai akses terbuka ("Estimasi Kuat Model Campuran Linier"). Status abstrak:Saya tidak punya cukup poin untuk komentar. Namun saya melihat perlunya untuk mengklarifikasi beberapa aspek dari jawaban @John di atas. Status Pinheiro dan Bates pada hal. 174:
Pernyataan ini memang tidak jelas tentang varian yang homogen dan saya tidak cukup mendalam dalam statistik untuk mengetahui semua matematika di balik konsep LME. Namun, pada hal. 175, §4.3.1, bagian yang berhubungan dengan Asumsi 1 yang mereka tulis:
Juga, dalam contoh berikut " varians konstan " memang penting. Dengan demikian, orang dapat berspekulasi apakah mereka menyiratkan varians yang homogen ketika mereka menulis " terdistribusi secara identik " pada hal. 174 tanpa mengatasinya lebih langsung.
sumber
T1: Ya, mengapa tidak?
T2: Saya pikir persyaratannya adalah bahwa kesalahan didistribusikan secara normal.
Q3: Dapat diuji dengan uji Leven misalnya.
sumber