Ada banyak diskusi yang terjadi di forum ini tentang cara yang tepat untuk menentukan berbagai model hirarkis yang digunakan lmer
.
Saya pikir akan bagus jika memiliki semua informasi di satu tempat. Beberapa pertanyaan untuk memulai:
- Bagaimana cara menentukan beberapa level, di mana satu kelompok bersarang di dalam yang lain: apakah itu
(1|group1:group2)
atau(1+group1|group2)
? - Apa perbedaan antara
(~1 + ....)
dan(1 | ...)
dan(0 | ...)
sebagainya? - Bagaimana cara menentukan interaksi tingkat grup?
lme4
paket dapat ditemukan di CRANlmer
adalah kepentingan statistik umum dan dengan demikian bukan semata-mata masalah pemrograman. Karena itu saya memberikan suara untuk menjaga utas ini terbuka.Jawaban:
Katakanlah Anda memiliki variabel V1 yang diprediksi oleh variabel kategori V2, yang diperlakukan sebagai efek acak, dan variabel kontinu V3, yang diperlakukan sebagai efek tetap linier. Menggunakan sintaks lmer, model paling sederhana (M1) adalah:
Model ini akan memperkirakan:
P1: Pencegatan global
P2: Penyadapan efek acak untuk V2 (yaitu untuk setiap tingkat V2, penyimpangan penyadapan tingkat itu dari penyadapan global)
P3: Perkiraan global tunggal untuk efek (kemiringan) V3
Model paling kompleks berikutnya (M2) adalah:
Model ini memperkirakan semua parameter dari M1, tetapi juga akan memperkirakan:
P4: Efek V3 dalam setiap level V2 (lebih khusus lagi, sejauh mana efek V3 dalam level tertentu menyimpang dari efek global V3), sementara menegakkan korelasi nol antara penyimpangan intersep dan penyimpangan efek V3 lintas level. dari V2 .
Pembatasan yang terakhir ini santai dalam model paling kompleks akhir (M3):
Di mana semua parameter dari M2 diestimasi sementara memungkinkan korelasi antara penyimpangan intersep dan penyimpangan efek V3 dalam level V2. Jadi, dalam M3, parameter tambahan diperkirakan:
P5: Korelasi antara deviasi intersep dan deviasi V3 lintas level V2
Biasanya pasangan model seperti M2 dan M3 dihitung kemudian dibandingkan untuk mengevaluasi bukti korelasi antara efek tetap (termasuk intersep global).
Sekarang pertimbangkan untuk menambahkan prediktor efek tetap lain, V4. Model:
akan memperkirakan:
P1: Pencegatan global
P2: Perkiraan global tunggal untuk efek V3
P3: Perkiraan global tunggal untuk efek V4
P4: Perkiraan global tunggal untuk interaksi antara V3 dan V4
P5: Penyimpangan intersep dari P1 di setiap level V2
P6: Penyimpangan efek V3 dari P2 di setiap level V2
P7: Penyimpangan efek V4 dari P3 di setiap level V2
P8: Penyimpangan interaksi V3-by-V4 dari P4 di setiap level V2
P9 Korelasi antara P5 dan P6 lintas level V2
P10 Korelasi antara P5 dan P7 lintas level V2
P11 Korelasi antara P5 dan P8 lintas level V2
P12 Korelasi antara P6 dan P7 lintas level V2
P13 Korelasi antara P6 dan P8 lintas level V2
P14 Korelasi antara P7 dan P8 lintas level V2
Fiuh , itu banyak parameter! Dan saya bahkan tidak repot-repot mendaftar parameter varians yang diperkirakan oleh model. Terlebih lagi, jika Anda memiliki variabel kategori dengan lebih dari 2 level yang ingin Anda modelkan sebagai efek tetap, alih-alih efek tunggal untuk variabel itu, Anda akan selalu memperkirakan efek k-1 (di mana k adalah jumlah level) , sehingga meledak jumlah parameter yang akan diperkirakan oleh model lebih jauh.
sumber
lmer
Y~X+Z+(1|group)+(0+X|Z)
group
Trik yang umum adalah, sebagaimana disebutkan dalam jawaban lain , adalah bahwa rumus mengikuti formulir
dependent ~ independent | grouping
. Secaragrouping
umum faktor acak, Anda dapat memasukkan faktor tetap tanpa pengelompokan apa pun dan Anda dapat memiliki faktor acak tambahan tanpa faktor tetap (model intersep-only). A+
antara faktor menunjukkan tidak ada interaksi, a*
menunjukkan interaksi.Untuk faktor acak, Anda memiliki tiga varian dasar:
(1 | random.factor)
(0 + fixed.factor | random.factor)
(1 + fixed.factor | random.factor)
Perhatikan bahwa varian 3 memiliki kemiringan dan intersep yang dihitung dalam pengelompokan yang sama, yaitu pada saat yang sama. Jika kita ingin kemiringan dan intersep dihitung secara independen, yaitu tanpa korelasi yang diasumsikan antara keduanya, kita perlu varian keempat:
(1 | random.factor) + (0 + fixed.factor | random.factor)
. Cara alternatif untuk menulis ini adalah menggunakan notasi bilah gandafixed.factor + (fixed.factor || random.factor)
.Ada juga ringkasan yang bagus dalam tanggapan lain terhadap pertanyaan ini yang harus Anda perhatikan.
Jika Anda ingin menggali sedikit dalam matematika, Barr et al. (2013) meringkas
lmer
sintaks dengan cukup baik dalam Tabel 1 mereka, diadaptasi di sini untuk memenuhi kendala penurunan harga yang tidak ada. Makalah itu membahas data psikolinguistik, sehingga dua efek acak adalahSubject
danItem
.Model dan
lme4
sintaks rumus setara :Y ∼ X+(1∣Subject)
Y ∼ X+(1 + X∣Subject)
Y ∼ X+(1 + X∣Subject)+(1∣Item)
Y ∼ X+(1∣Subject)+(1∣Item)
Y ∼ X+(1∣Subject)+(0 + X∣ Subject)+(1∣Item)
Y ∼ X+(0 + X∣Subject)+(1∣Item)
Referensi:
Barr, Dale J, R. Levy, C. Scheepers dan HJ Tily (2013). Struktur efek acak untuk pengujian hipotesis konfirmasi: Tetap maksimal . Jurnal Memori dan Bahasa, 68: 255-278.
sumber
The
|
simbol menunjukkan faktor pengelompokan dalam metode campuran.Sesuai Pinheiro & Bates:
Bergantung pada metode yang Anda gunakan untuk melakukan analisis metode campuran
R
, Anda mungkin perlu membuatgroupedData
objek untuk dapat menggunakan pengelompokan dalam analisis (lihatnlme
paket untuk detailnya,lme4
sepertinya tidak memerlukan ini). Saya tidak dapat berbicara dengan cara Anda menentukanlmer
pernyataan model Anda karena saya tidak tahu data Anda. Namun, memiliki banyak(1|foo)
dalam garis model tidak biasa dari apa yang saya lihat. Apa yang Anda coba modelkan?sumber