Saya pikir saya bisa menjawab pertanyaan Anda setidaknya mengenai perkiraan pengulangan yang tidak disesuaikan , yaitu, korelasi intra-kelas klasik (ICC). Mengenai perkiraan pengulangan yang "disesuaikan", saya membaca sekilas kertas yang Anda tautkan dan tidak benar-benar melihat di mana rumus yang Anda gunakan dapat ditemukan di koran? Berdasarkan ekspresi matematis, nampaknya pengulangan skor rata-rata (bukan skor individu). Tetapi tidak jelas bahwa ini adalah bagian penting dari pertanyaan Anda, jadi saya akan mengabaikannya.
(1.) Apakah perhitungan di atas untuk mendapatkan estimasi titik pengulangan efek masuk akal?
Ya, ekspresi yang Anda usulkan memang masuk akal, tetapi sedikit modifikasi pada formula yang Anda usulkan diperlukan. Di bawah ini saya menunjukkan bagaimana seseorang dapat menurunkan koefisien pengulangan yang Anda usulkan. Saya harap ini memperjelas arti konseptual dari koefisien dan juga menunjukkan mengapa diinginkan untuk mengubahnya sedikit.
Untuk memulai, pertama mari kita ambil koefisien pengulangan dalam kasus pertama Anda dan klarifikasi apa artinya dan dari mana asalnya. Memahami ini akan membantu kita untuk memahami kasus kedua yang lebih rumit.
Hanya penyadapan acak
Dalam kasus ini, model campuran untuk tanggapan ke- dalam kelompok ke- adalah
mana penyadapan acak memiliki varian dan residual memiliki varian .ij
yij=β0+u0j+eij,
u0jσ2u0eijσ2e
Sekarang, korelasi antara dua variabel acak dan didefinisikan sebagai
xy
corr=cov(x,y)var(x)var(y)−−−−−−−−−−√.
Ekspresi untuk ICC / koefisien pengulangan kemudian berasal dari membiarkan dua variabel acak dan menjadi dua pengamatan yang diambil dari kelompok sama ,
dan jika Anda menyederhanakan ini menggunakan definisi yang diberikan di atas dan properti varians / kovarian (proses yang tidak akan saya tunjukkan di sini, kecuali Anda atau orang lain lebih suka yang saya lakukan), Anda berakhir dengan
xyj
sayaCC= c o v ( β0+ u0 j+ esaya1j, β0+ u0 j+ esaya2j)v a r ( β0+ u0 j+ esaya1j) v a r ( β0+ u0 j+ esaya2j)------------------------------√,
sayaCC= σ2kamu0σ2kamu0+ σ2e.
Apa artinya ini adalah bahwa ICC atau "koefisien pengulangan yang tidak disesuaikan" dalam kasus ini memiliki interpretasi sederhana sebagai korelasi yang diharapkan antara pengamatan pasangan dari cluster yang sama (bersih dari efek tetap, yang dalam kasus ini hanya rata-rata besar). Fakta bahwa ICC juga dapat ditafsirkan sebagai
proporsi varian dalam kasus ini adalah kebetulan; penafsiran itu tidak benar secara umum untuk ICC yang lebih rumit. Interpretasi sebagai semacam korelasi adalah yang utama.
Penyadapan acak dan lereng acak
Sekarang untuk kasus kedua, pertama-tama kita harus mengklarifikasi apa yang dimaksud dengan "keandalan efek (yaitu jumlah efek kontras variabel dengan 2 level)" - kata-kata Anda.
Pertama kita paparkan modelnya. Model campuran untuk tanggapan ke- dalam kelompok ke- bawah tingkat ke- dari prediktor berkode kontras adalah
mana intersep acak memiliki varians , lereng acak memiliki varians , intersep acak dan lereng memiliki kovarians , dan residu memiliki varian .sayajkx
yijk=β0+β1xk+u0j+u1jxk+eijk,
σ2u0σ2u1σu01eijσ2e
Jadi apa "pengulangan efek" di bawah model ini? Saya pikir definisi kandidat yang baik adalah bahwa itu adalah korelasi yang diharapkan antara dua pasang skor perbedaan yang dihitung dalam cluster sama , tetapi di antara pasangan pengamatan yang berbeda .ji
Jadi pasangan skor selisih yang dimaksud adalah (ingat bahwa kami mengasumsikan adalah kode kontras sehingga ):
dan
x|x1|=|x2|=x
yi1jk2−yi1jk1=(β0−β0)+β1(xk2−xk1)+(u0j−u0j)+u1j(xk2−xk1)+(ei1jk2−ei1jk1)=2xβ1+2xu1j+ei1jk2−ei1jk1
yi2jk2−yi2jk1=2xβ1+2xu1j+ei2jk2−ei2jk1.
Memasukkan ini ke dalam rumus korelasi memberi kita
yang disederhanakan menjadi
Perhatikan bahwa ICC secara teknis adalah fungsi dari ! Namun, dalam hal ini hanya dapat mengambil 2 nilai yang mungkin, dan ICC identik pada kedua nilai ini.
ICC=cov(2xβ1+2xu1j+ei1jk2−ei1jk1,2xβ1+2xu1j+ei2jk2−ei2jk1)var(2xβ1+2xu1j+ei1jk2−ei1jk1)var(2xβ1+2xu1j+ei2jk2−ei2jk1)−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−√,
xxICC=2x2σ2u12x2σ2u1+σ2e.
xx
Seperti yang Anda lihat, ini sangat mirip dengan koefisien pengulangan yang Anda usulkan dalam pertanyaan Anda, satu-satunya perbedaan adalah bahwa varians kemiringan acak harus diskalakan dengan tepat jika ekspresi tersebut harus ditafsirkan sebagai ICC atau "koefisien pengulangan yang tidak disesuaikan." Ekspresi yang Anda tulis bekerja dalam kasus khusus di mana prediktor dikodekan , tetapi tidak secara umum.± 1x±12√
(2.) Ketika saya memiliki beberapa variabel yang pengulangannya ingin saya perkirakan, menambahkan semuanya ke kesesuaian yang sama (misalnya lmer(dv~(iv1+iv2|unit)+iv1+iv2
) tampaknya menghasilkan perkiraan pengulangan yang lebih tinggi daripada membuat model terpisah untuk setiap efek. Ini masuk akal secara komputasi bagi saya, karena dimasukkannya beberapa efek akan cenderung mengurangi varians residual, tetapi saya tidak yakin bahwa perkiraan pengulangan yang dihasilkan valid. Apakah mereka?
Saya percaya bahwa bekerja melalui derivasi yang sama seperti yang disajikan di atas untuk model dengan beberapa prediktor dengan kemiringan acak mereka sendiri akan menunjukkan bahwa koefisien pengulangan di atas masih akan valid, kecuali untuk komplikasi tambahan bahwa skor perbedaan yang secara konseptual kita tertarik sekarang akan memiliki definisi yang sedikit berbeda: yaitu, kami tertarik pada korelasi yang diharapkan dari perbedaan antara rata-rata yang disesuaikan setelah mengendalikan prediktor lain dalam model.
Jika prediktor lain ortogonal dengan prediktor minat (seperti dalam, misalnya, percobaan yang seimbang), saya akan berpikir ICC / koefisien pengulangan yang diuraikan di atas harus bekerja tanpa modifikasi. Jika mereka tidak ortogonal maka Anda perlu memodifikasi rumus untuk memperhitungkan ini, yang bisa menjadi rumit, tetapi mudah-mudahan jawaban saya telah memberikan beberapa petunjuk tentang seperti apa itu.