Saya memiliki model berikut yang m_plot
dilengkapi dengan lme4::lmer
efek acak silang untuk peserta ( lfdn
) dan item ( content
):
Random effects:
Groups Name Variance Std.Dev. Corr
lfdn (Intercept) 172.173 13.121
role1 62.351 7.896 0.03
inference1 24.640 4.964 0.08 -0.30
inference2 52.366 7.236 -0.05 0.17 -0.83
inference3 21.295 4.615 -0.03 0.22 0.86 -0.77
content (Intercept) 23.872 4.886
role1 2.497 1.580 -1.00
inference1 18.929 4.351 0.52 -0.52
inference2 14.716 3.836 -0.16 0.16 -0.08
inference3 17.782 4.217 -0.17 0.17 0.25 -0.79
role1:inference1 9.041 3.007 0.10 -0.10 -0.10 -0.21 0.16
role1:inference2 5.968 2.443 -0.60 0.60 -0.11 0.78 -0.48 -0.50
role1:inference3 4.420 2.102 0.30 -0.30 0.05 -0.97 0.71 0.37 -0.90
Residual 553.987 23.537
Number of obs: 3480, groups: lfdn, 435 content, 20
Saya ingin mengetahui Koefisien Korelasi Intraclass (ICC) untuk peserta dan item. Berkat jawaban yang bagus ini saya pada prinsipnya tahu cara mendapatkan ICC untuk model saya. Namun, saya tidak yakin apakah termasuk lereng acak atau tidak:
vars <- lapply(summary(m_plot)$varcor, diag)
resid_var <- attr(summary(m_plot)$varcor, "sc")^2
total_var <- sum(sapply(vars, sum), resid_var)
# with random slopes
sapply(vars, sum)/total_var
## lfdn content
## 0.33822396 0.09880349
# only random intercepts:
sapply(vars, function(x) x[1]) / total_var
## lfdn.(Intercept) content.(Intercept)
## 0.17496587 0.02425948
Apa ukuran yang sesuai untuk korelasi antara dua tanggapan dari peserta yang sama masing-masing dengan item yang sama?
Jawaban:
Pada dasarnya tidak ada angka tunggal atau perkiraan yang dapat merangkum tingkat pengelompokan dalam model lereng acak.
Korelasi intra-kelas (ICC) hanya dapat ditulis sebagai proporsi varian sederhana dalam model acak-penyadapan saja. Untuk mengetahui alasannya, sketsa derivasi dari ekspresi ICC dapat ditemukan di sini .
Ketika Anda melempar lereng acak ke dalam persamaan model, mengikuti langkah-langkah yang sama sebagai gantinya mengarah ke ekspresi ICC pada halaman 5 makalah ini . Seperti yang Anda lihat, ekspresi rumit itu adalah fungsi dari prediktor X. Untuk melihat lebih intuitif mengapa var (Y) bergantung pada X ketika ada lereng acak, periksa halaman 30 slide ini ("Mengapa varians bergantung pada x ? ") .
Karena ICC adalah fungsi dari prediktor (nilai x), ia hanya dapat dihitung untuk set nilai x tertentu. Anda mungkin bisa mencoba sesuatu seperti melaporkan ICC pada rata-rata gabungan dari nilai-x, tetapi perkiraan ini akan terbukti tidak akurat untuk sebagian besar pengamatan.
Semua yang saya katakan masih hanya merujuk pada kasus di mana ada faktor acak tunggal. Dengan banyak faktor acak, ini menjadi semakin rumit. Misalnya, dalam proyek multi-situs di mana peserta di setiap situs menanggapi sampel rangsangan (yaitu, 3 faktor acak: situs, peserta, stimulus), kita dapat bertanya tentang banyak ICC yang berbeda: Apa korelasi yang diharapkan antara dua tanggapan di situs yang sama, ke stimulus yang sama, dari peserta yang berbeda? Bagaimana dengan di situs yang berbeda, stimulus yang sama, dan peserta yang berbeda? Dan seterusnya. @rvl menyebutkan komplikasi ini dalam jawaban yang ditautkan oleh OP.
Jadi seperti yang Anda lihat, satu-satunya kasus di mana kita dapat meringkas tingkat pengelompokan dengan nilai tunggal adalah kasus faktor-tunggal-acak-faktor-saja-acak. Karena ini adalah sebagian kecil dari kasus dunia nyata, ICCs tidak begitu berguna sepanjang waktu. Jadi rekomendasi umum saya adalah untuk tidak khawatir tentang mereka. Sebagai gantinya saya merekomendasikan hanya melaporkan komponen varians (lebih disukai dalam bentuk standar deviasi).
sumber