Dengan variabel yang diprediksi (P), efek acak (R) dan efek tetap (F), orang dapat memuat dua * model efek campuran ( sintaks lme4 ):
m1 = lmer( P ~ (1|R) + F )
m2 = lmer( P ~ (1+F|R) + F)
Seperti yang saya pahami, model kedua adalah model yang memungkinkan efek tetap bervariasi di seluruh level efek acak.
Dalam penelitian saya, saya biasanya menggunakan model efek campuran untuk menganalisis data dari eksperimen yang dilakukan di beberapa peserta manusia. Saya memodelkan peserta sebagai efek acak dan manipulasi eksperimental sebagai efek tetap. Saya pikir masuk akal apriori untuk membiarkan sejauh mana efek tetap mempengaruhi kinerja dalam percobaan bervariasi di antara peserta. Namun, saya mengalami kesulitan membayangkan keadaan di mana saya harus atau tidak mengizinkan efek tetap bervariasi di berbagai tingkat efek acak, jadi pertanyaan saya adalah:
Kapan seseorang seharusnya tidak mengizinkan efek tetap bervariasi di berbagai tingkat efek acak?
sumber
Jawaban:
Saya bukan ahli dalam pemodelan efek campuran, tetapi pertanyaannya jauh lebih mudah dijawab jika diulang dalam konteks pemodelan regresi hierarkis. Jadi pengamatan kami memiliki dua indeks dan F i j dengan indeks i mewakili kelas dan j anggota kelas. Model hierarkis marilah kita menyesuaikan regresi linier, di mana koefisien bervariasi antar kelas:Pij Fij i j
Ini adalah regresi tingkat pertama kami. Regresi tingkat kedua dilakukan pada koefisien regresi pertama:
ketika kita menggantikan ini dalam regresi tingkat pertama yang kita dapatkan
Di sini adalah efek tetap dan u adalah efek acak. Perkiraan model campuran γ dan varian u .γ u γ u
Model yang saya tulis sesuai dengan
lmer
sintaksSekarang jika kita menempatkan tanpa istilah acak yang kita dapatkanβ1i=γ01
yang sesuai dengan
lmer
sintaksJadi pertanyaannya sekarang adalah kapan kita bisa mengecualikan istilah kesalahan dari regresi tingkat kedua? Jawaban kanonik adalah bahwa ketika kita yakin bahwa para regresi (di sini kita tidak memiliki, tetapi kita dapat memasukkan mereka, mereka secara alami adalah konstan dalam kelas-kelas) dalam regresi tingkat kedua sepenuhnya menjelaskan varian koefisien di seluruh kelas.
Jadi dalam kasus khusus ini jika koefisien tidak bervariasi, atau sebagai alternatif varian u 1 iFsaya j kamu1 i sangat kecil, kita harus menghibur gagasan bahwa kita mungkin lebih baik menggunakan model pertama.
Catatan . Saya hanya memberikan penjelasan aljabar, tetapi saya pikir dengan mengingatnya, lebih mudah untuk memikirkan contoh terapan tertentu.
sumber
Anda dapat menganggap "Efek tetap" sebagai "efek acak" dengan komponen varian nol.
Jadi, jawaban sederhana untuk mengapa Anda tidak membiarkan efek tetap bervariasi, tidak cukup bukti untuk komponen varians "cukup besar". Bukti harus berasal dari informasi sebelumnya dan data. Ini sejalan dengan prinsip dasar "pisau cukur": jangan buat model Anda lebih rumit dari yang seharusnya.
Saya cenderung memikirkan model campuran linier dengan cara berikut, menuliskan regresi berganda sebagai berikut:
Bandingkan ini dengan regresi OLS (yang memilikiZ= 0 ) dan kami mendapatkan:
Jadi bagian "acak" dari model dapat dilihat sebagai cara menentukan informasi sebelumnya tentang struktur korelasi komponen noise atau error dalam model. OLS pada dasarnya mengasumsikan bahwa satu kesalahan dari bagian tetap dari model dalam satu kasus tidak berguna untuk memprediksi kesalahan lain, bahkan jika kita tahu bagian tetap dari model dengan pasti. Menambahkan efek acak pada dasarnya mengatakan bahwa Anda pikir beberapa kesalahan mungkin berguna dalam memprediksi kesalahan lainnya.
sumber
Ini adalah pertanyaan yang cukup lama dengan beberapa jawaban yang sangat bagus, namun saya pikir ini bisa mendapat manfaat dari jawaban baru untuk mengatasi perspektif yang lebih pragmatis.
Saya tidak akan membahas masalah yang sudah dijelaskan dalam jawaban lain, sebaliknya saya akan merujuk pada yang sekarang terkenal, meskipun saya lebih suka mengatakan kertas "terkenal" oleh Barr et al (2013) sering hanya disebut sebagai "Keep it maximal"
Barr, DJ, Levy, R., Scheepers, C. dan Tily, HJ, 2013. Struktur efek acak untuk pengujian hipotesis konfirmasi: Tetap maksimal. Jurnal memori dan bahasa, 68 (3), hlm.255-278.
Dalam makalah ini penulis berpendapat bahwa semua efek tetap harus dibiarkan bervariasi di berbagai tingkat faktor pengelompokan (intersepsi acak). Argumen mereka cukup meyakinkan - pada dasarnya bahwa dengan tidak membiarkan mereka bervariasi, itu memaksakan kendala pada model. Ini dijelaskan dengan baik dalam jawaban lain. Namun, ada potensi masalah serius dengan pendekatan ini, yang dijelaskan oleh Bates el al (2015):
Bates, D., Kliegl, R., Vasishth, S. dan Baayen, H., 2015. model campuran Parsimonious. arXiv preprint arXiv: 1506.04967
Perlu dicatat di sini bahwa Bates adalah penulis utama
lme4
paket untuk pemasangan model campuran dalam R, yang mungkin merupakan paket yang paling banyak digunakan untuk model-model tersebut. Bates et al mencatat bahwa dalam banyak aplikasi dunia nyata, data tidak akan mendukung struktur efek acak maksimal, sering kali karena ada jumlah pengamatan yang tidak mencukupi di setiap cluster untuk variabel yang relevan. Ini dapat memanifestasikan dirinya dalam model yang gagal bertemu, atau tunggal dalam efek acak. Sejumlah besar pertanyaan di situs ini tentang model semacam itu membuktikan hal itu. Mereka juga mencatat bahwa Barr et al menggunakan simulasi yang relatif sederhana, dengan efek acak "berperilaku baik" sebagai dasar untuk makalah mereka. Sebaliknya Bates dkk menyarankan pendekatan berikut:Di kertas yang sama, mereka juga mencatat:
Dan:
Bates et al (2015)
Dari perspektif yang lebih terapan, pertimbangan lebih lanjut yang harus dibuat adalah apakah atau tidak, proses pembuatan data, teori biologi / fisik / kimia yang mendasari data, harus memandu analis untuk menentukan struktur efek acak.
sumber