Dalam model multi-level, apa implikasi praktis dan terkait interpretasi parameter estimasi efek korelasi acak dan tidak diperkirakan? Alasan praktis untuk menanyakan hal ini adalah bahwa dalam kerangka lmer dalam R, tidak ada metode yang diimplementasikan untuk memperkirakan nilai-p melalui teknik MCMC ketika estimasi dibuat dalam model korelasi antara parameter.
Misalnya, dengan melihat contoh ini (bagian yang dikutip di bawah), apa implikasi praktis dari M2 versus M3. Jelas, dalam satu kasus P5 tidak akan diestimasi dan yang lain akan.
Pertanyaan
- Untuk alasan praktis (keinginan untuk mendapatkan nilai-p melalui teknik MCMC) orang mungkin ingin menyesuaikan model tanpa korelasi antara efek acak bahkan jika P5 secara substansial tidak nol. Jika seseorang melakukan ini, dan kemudian memperkirakan nilai-p melalui teknik MCMC, apakah hasilnya dapat diartikan? (Saya tahu @Ben Bolker sebelumnya menyebutkan bahwa "menggabungkan pengujian signifikansi dengan MCMC sedikit tidak jelas, secara statistik, meskipun saya memahami keinginan untuk melakukannya (mendapatkan interval kepercayaan lebih mendukung)" , jadi jika itu akan membuat Anda tidur lebih baik pada malam hari berpura-puralah aku mengatakan interval kepercayaan diri.)
- Jika seseorang gagal memperkirakan P5, apakah itu sama dengan menyatakan bahwa itu adalah 0?
- Jika P5 benar-benar bukan nol, maka dengan cara apa nilai estimasi P1-P4 terpengaruh?
- Jika P5 benar-benar bukan nol, maka dengan cara apa estimasi kesalahan untuk P1-P4 terpengaruh?
- Jika P5 benar-benar bukan nol, maka dalam hal apa interpretasi model gagal memasukkan P5 cacat?
Meminjam dari jawaban @Mike Lawrence (mereka yang lebih berpengetahuan daripada saya bebas untuk mengganti ini dengan notasi model penuh, saya tidak sepenuhnya yakin saya bisa melakukannya dengan kesetiaan yang wajar):
M2: V1 ~ (1|V2) + V3 + (0+V3|V2)
(Perkiraan P1 - P4)
M3: V1 ~ (1+V3|V2) + V3
(Perkiraan P1-P5)
Parameter yang mungkin diperkirakan:
P1 : Pencegatan global
P2 : Penyadapan efek acak untuk V2 (yaitu untuk setiap tingkat V2, penyimpangan penyadapan tingkat itu dari penyadapan global)
P3 : Perkiraan global tunggal untuk efek (kemiringan) V3
P4 : Efek V3 dalam setiap level V2 (lebih khusus lagi, sejauh mana efek V3 dalam level tertentu menyimpang dari efek global V3), sementara menegakkan korelasi nol antara penyimpangan intersep dan penyimpangan efek V3 lintas level. dari V2.
P5 : Korelasi antara deviasi intersep dan deviasi V3 lintas level V2
Jawaban yang berasal dari simulasi yang cukup besar dan luas bersama dengan kode yang menyertai dalam R menggunakan lmer akan diterima.
sumber
Jawaban:
Pertimbangkan data sleepstudy, termasuk dalam lme4. Bates membahas hal ini dalam buku daringnya tentang lme4. Dalam bab 3, ia mempertimbangkan dua model untuk data.
dan
Penelitian ini melibatkan 18 subjek, dipelajari selama 10 hari kurang tidur. Waktu reaksi dihitung pada awal dan pada hari-hari berikutnya. Ada efek yang jelas antara waktu reaksi dan durasi kurang tidur. Ada juga perbedaan yang signifikan antara subjek. Model A memungkinkan untuk kemungkinan interaksi antara mencegat acak dan efek lereng: bayangkan, katakanlah, bahwa orang dengan waktu reaksi yang buruk menderita lebih akut dari efek kurang tidur. Ini akan menyiratkan korelasi positif dalam efek acak.
Dalam contoh Bates, tidak ada korelasi yang jelas dari plot Lattice dan tidak ada perbedaan yang signifikan antara model. Namun, untuk menyelidiki pertanyaan yang diajukan di atas, saya memutuskan untuk mengambil nilai-nilai yang sesuai dari sleepstudy, meningkatkan korelasi dan melihat kinerja kedua model.
Seperti yang dapat Anda lihat dari gambar, waktu reaksi lama dikaitkan dengan kehilangan kinerja yang lebih besar. Korelasi yang digunakan untuk simulasi adalah 0,58
Saya mensimulasikan 1000 sampel, menggunakan metode simulasi di lme4, berdasarkan nilai-nilai yang pas dari data buatan saya. Saya cocok M0 dan Ma untuk masing-masing dan melihat hasilnya. Set data asli memiliki 180 pengamatan (10 untuk masing-masing 18 mata pelajaran), dan data yang disimulasikan memiliki struktur yang sama.
Intinya adalah bahwa ada sedikit perbedaan.
Jadi mengapa ini terjadi? @ung menduga, cukup, bahwa kegagalan untuk memasukkan kemungkinan korelasi memaksa efek acak menjadi tidak berkorelasi. Mungkin seharusnya; tetapi dalam implementasi ini, efek acak diizinkan untuk dikorelasikan, yang berarti bahwa data dapat menarik parameter ke arah yang benar, terlepas dari modelnya. Kesalahan dari model yang salah muncul dalam kemungkinan, itulah sebabnya Anda dapat (kadang-kadang) membedakan dua model di tingkat itu. Model efek campuran pada dasarnya sesuai dengan regresi linier untuk setiap subjek, dipengaruhi oleh apa yang menurut model seharusnya. Model yang salah memaksa kecocokan nilai yang kurang masuk akal daripada yang Anda dapatkan di bawah model yang tepat. Tetapi parameter, pada akhirnya, diatur oleh kecocokan dengan data aktual.
Ini kode saya yang agak kikuk. Idenya adalah agar sesuai dengan data studi tidur dan kemudian membangun set data simulasi dengan parameter yang sama, tetapi korelasi yang lebih besar untuk efek acak. Kumpulan data diumpankan ke simulasi.lmer () untuk mensimulasikan 1000 sampel, yang masing-masing sesuai dengan kedua cara. Setelah saya memasangkan objek yang pas, saya bisa mengeluarkan fitur yang berbeda dari fit dan membandingkannya, menggunakan uji-t, atau apa pun.
sumber
Placidia telah memberikan jawaban menyeluruh menggunakan data simulasi berdasarkan pada
sleepstudy
dataset. Berikut adalah jawaban lain (kurang ketat) yang juga menggunakansleepstudy
data.Kita melihat bahwa seseorang dapat mempengaruhi perkiraan korelasi antara intersepsi acak dan kemiringan acak dengan "menggeser" variabel prediktor acak. Lihatlah hasil dari model
fm1
dan difm2
bawah ini:Dari output model, kita melihat bahwa korelasi varians acak telah berubah. Namun, lereng (tetap dan acak) tetap sama, seperti yang dilakukan estimasi varians residual. Estimasi intersep (tetap dan acak) berubah sebagai respons terhadap variabel yang bergeser.
De-berkorelasi kovariansi mencegat-lereng acak untuk LMM dibahas dalam catatan kuliah Dr. Jack Weiss di sini . Weiss mencatat bahwa mengurangi korelasi varians dalam mode ini kadang-kadang dapat membantu dengan konvergensi model, antara lain.
Contoh di atas memvariasikan korelasi acak (parameter "P5"). Mengatasi sebagian OP Q3, kita melihat dari output di atas bahwa:
sumber