Pertanyaan tentang bagaimana efek acak ditentukan dalam lmer

55

Baru-baru ini saya mengukur bagaimana arti kata baru diperoleh dari eksposur berulang (praktek: hari 1 hingga hari 10) dengan mengukur ERP (EEG) ketika kata itu dilihat dalam konteks yang berbeda. Saya juga mengendalikan sifat-sifat konteks, misalnya, kegunaannya untuk penemuan makna kata baru (tinggi vs rendah). Saya terutama tertarik pada efek latihan (hari). Karena rekaman ERP individu berisik, nilai-nilai komponen ERP diperoleh dengan rata-rata selama percobaan kondisi tertentu. Dengan lmerfungsinya, saya menerapkan rumus berikut:

lmer(ERPindex ~ practice*context + (1|participants), data=base) 

dan

lmer(ERPindex ~ practice*context + (1+practice|participants), data=base) 

Saya juga telah melihat setara dengan efek acak berikut dalam literatur:

lmer(ERPindex ~ practice*context + (practice|participants) + 
                (practice|participants:context), data=base) 

Apa yang dicapai dengan menggunakan faktor acak formulir participants:context? Apakah ada sumber yang baik yang akan memungkinkan seseorang dengan hanya pengetahuan sepintas tentang aljabar matriks memahami dengan tepat faktor acak apa yang dilakukan dalam model campuran linier dan bagaimana mereka harus dipilih?

alwin hoff
sumber

Jawaban:

77

Saya akan menjelaskan model apa yang lmer()cocok untuk setiap panggilan Anda dan bagaimana mereka berbeda dan kemudian menjawab pertanyaan terakhir Anda tentang memilih efek acak.

Masing-masing dari tiga model Anda mengandung efek tetap untuk practice, contextdan interaksi antara keduanya. Efek acak berbeda antara model.

lmer(ERPindex ~ practice*context + (1|participants), data=base) 

participantsparticipant0

lmer(ERPindex ~ practice*context + (1+practice|participants), data=base) 

Model ini, selain intersep acak, juga berisi kemiringan acak di practice. Ini berarti bahwa tingkat di mana individu belajar dari latihan berbeda dari orang ke orang. Jika seseorang memiliki efek acak positif, maka mereka meningkat lebih cepat dengan latihan daripada rata-rata, sementara efek acak negatif menunjukkan mereka belajar kurang cepat dengan latihan daripada rata-rata, atau mungkin lebih buruk dengan latihan, tergantung pada varian acak efek (ini mengasumsikan efek tetap praktik positif).

lmer(ERPindex ~ practice*context + (practice|participants) + 
                (practice|participants:context), data=base) 

Model ini cocok dengan kemiringan acak dan intersep practice(yang harus Anda lakukan (practice-1|...)untuk menekan intersep), sama seperti model sebelumnya, tetapi sekarang Anda juga menambahkan kemiringan acak dan intersep dalam faktor participants:context, yang merupakan faktor baru yang levelnya adalah setiap kombinasi dari level yang ada participantsdan contextdan efek acak yang sesuai dibagikan dengan pengamatan yang memiliki nilai yang sama untuk keduanya participantsdan context. Agar sesuai dengan model ini, Anda harus memiliki beberapa pengamatan yang memiliki nilai yang sama untuk keduanya participantsdancontextatau model tidak dapat diperkirakan. Dalam banyak situasi, grup yang dibuat oleh variabel interaksi ini sangat jarang dan menghasilkan model efek acak yang sangat bising / sulit untuk dicocokkan, jadi Anda ingin berhati-hati saat menggunakan faktor interaksi sebagai variabel pengelompokan.

Pada dasarnya (baca: tanpa menjadi terlalu rumit) efek acak harus digunakan ketika Anda berpikir bahwa variabel pengelompokan menentukan "kantong" ketidakhomogenan dalam kumpulan data atau bahwa individu yang memiliki level faktor pengelompokan yang sama harus dikorelasikan satu sama lain (sementara individu yang tidak seharusnya tidak berkorelasi) - efek acak mencapai ini. Jika Anda berpikir pengamatan yang berbagi level keduanya participantsdan contextlebih mirip daripada jumlah kedua bagian maka memasukkan efek acak "interaksi" mungkin tepat.

Sunting: Seperti @ Henrik menyebutkan dalam komentar, model yang Anda cocok, misalnya:

lmer(ERPindex ~ practice*context + (1+practice|participants), data=base)

membuatnya sedemikian rupa sehingga kemiringan acak dan intersepsi acak saling berkorelasi, dan korelasi tersebut diperkirakan oleh model. Untuk membatasi model sehingga kemiringan acak dan intersep acak tidak berkorelasi (dan karena itu independen, karena mereka terdistribusi secara normal), Anda akan lebih cocok dengan model:

lmer(ERPindex ~ practice*context + (1|participants) + (practice-1|participants), 
     data=base)

Pilihan antara keduanya harus didasarkan pada apakah Anda berpikir, misalnya, participants dengan garis dasar lebih tinggi daripada rata-rata (yaitu intersep acak positif) juga cenderung memiliki tingkat perubahan yang lebih tinggi daripada rata-rata (yaitu kemiringan acak positif). Jika demikian, Anda akan membiarkan keduanya berkorelasi sedangkan jika tidak, Anda akan membatasi mereka untuk mandiri. (Sekali lagi, contoh ini mengasumsikan kemiringan efek tetap adalah positif).

Makro
sumber
2
Saya tidak ingin pilih-pilih, tetapi bukankah model kedua juga mengandung korelasi antara intersep dan lereng. Menambahkan lereng seharusnya: lmer(ERPindex ~ practice*context + (1|participants) + (0 + practice|participants, data=base)Atau apakah saya salah? (Tidak terkait: Maafkan suntingan kecil saya dari posting Anda. Jika Anda tidak setuju dengan klarifikasi, cukup ubah kembali)
Henrik
@ Henrik, ya Anda benar bahwa itu juga memperkirakan korelasi antara dua efek acak. Dalam menulis jawaban ini, saya mencoba memberikan ide "gambaran besar" tentang apa yang terjadi dengan model-model ini, yang tidak termasuk menyebutkan korelasi antara efek acak, yang tidak memiliki deskripsi "dua sen" sederhana yang cara lereng dan mencegat lakukan :) Dalam hal apapun, saya tidak berpikir kelalaian ini membuat interpretasi yang saya buat dalam jawaban saya salah. BTW, terima kasih untuk hasil editnya.
Makro
1
@ Henrik, saya menambahkan catatan tentang perbedaan antara membuat efek acak berkorelasi vs tidak berkorelasi yang menurut saya meningkatkan jawabannya - terima kasih telah menunjukkannya.
Makro
Terima kasih. Saya mencoba untuk masuk ke hal pemodelan campuran dan juga berjuang dengan pertanyaan tentang bagaimana dan kapan menggunakan struktur efek acak mana, yang saya hanya ingin memastikan. Singkatnya, jawaban yang bagus (+1).
Henrik
1
@ Pom, terima kasih atas pujiannya. Re: komentar Anda, saya sudah menguji ini pada data simulasi dan saya pikir Anda memilikinya mundur. Model kedua di bawah edit saya memiliki satu parameter lebih sedikit daripada yang pertama. Ini karena model kedua membatasi korelasi antara dua efek acak menjadi nol. Selain itu modelnya sama. Saya tidak yakin apa yang Anda hadapi tetapi contoh yang direproduksi akan membantu. Ini milik saya:x <-rnorm(1000); id <- rep(1:100,each=10); y <- rnorm(1000); g <- lmer(y ~ (1+x|id)); g2 <- lmer(y ~ (1|id) + (x-1|id)); attr(logLik(g),"df"); attr(logLik(g2),"df");
Makro
13

@ Macro telah memberikan jawaban yang bagus di sini, saya hanya ingin menambahkan satu poin kecil. Jika beberapa orang dalam situasi Anda menggunakan:

lmer(ERPindex ~ practice*context + (practice|participants) + 
                (practice|participants:context), data=base) 

Saya curiga mereka membuat kesalahan. Pertimbangkan: (practice|participants)berarti ada kemiringan acak (dan intersep) untuk efek practicemasing-masing participant, sedangkan (practice|participants:context)berarti ada kemiringan acak (dan intersep) untuk efek practiceuntuk setiap participant by context kombinasi . Ini baik-baik saja, jika itu yang mereka inginkan, tapi saya menduga mereka ingin (practice:context|participants), yang berarti bahwa ada lereng acak (dan intercept) untuk efek interaksi dari practice by contextmasing-masing participant.

gung - Reinstate Monica
sumber
4

Dalam model efek acak atau efek campuran, efek acak digunakan ketika Anda ingin memperlakukan efek yang Anda amati seolah-olah itu diambil dari beberapa kemungkinan distribusi efek.

Salah satu contoh terbaik yang bisa saya berikan adalah ketika memodelkan data uji klinis dari uji klinis multisenter. Efek situs sering dimodelkan sebagai efek acak. Ini dilakukan karena 20 atau lebih situs yang sebenarnya digunakan dalam uji coba diambil dari kelompok situs potensial yang jauh lebih besar. Dalam praktiknya, pemilihannya mungkin tidak dilakukan secara acak, tetapi masih mungkin berguna untuk memperlakukannya seolah-olah memang demikian.

Sementara efek situs bisa dimodelkan sebagai efek tetap, akan sulit untuk menggeneralisasi hasil ke populasi yang lebih besar jika kita tidak memperhitungkan fakta bahwa efek untuk kumpulan 20 situs terpilih yang berbeda akan berbeda. Memperlakukannya sebagai efek acak memungkinkan kita untuk memperhitungkannya seperti itu.

Michael Chernick
sumber
1
-1 karena jawaban ini tidak menjawab pertanyaan aktual di sini.
Amoeba berkata Reinstate Monica