Koefisien Korelasi Intraclass dalam model campuran dengan lereng acak

10

Saya memiliki model berikut yang m_plotdilengkapi dengan lme4::lmerefek acak silang untuk peserta ( lfdn) dan item ( content):

Random effects:
 Groups   Name             Variance Std.Dev. Corr                                     
 lfdn     (Intercept)      172.173  13.121                                            
          role1             62.351   7.896    0.03                                    
          inference1        24.640   4.964    0.08 -0.30                              
          inference2        52.366   7.236   -0.05  0.17 -0.83                        
          inference3        21.295   4.615   -0.03  0.22  0.86 -0.77                  
 content  (Intercept)       23.872   4.886                                            
          role1              2.497   1.580   -1.00                                    
          inference1        18.929   4.351    0.52 -0.52                              
          inference2        14.716   3.836   -0.16  0.16 -0.08                        
          inference3        17.782   4.217   -0.17  0.17  0.25 -0.79                  
          role1:inference1   9.041   3.007    0.10 -0.10 -0.10 -0.21  0.16            
          role1:inference2   5.968   2.443   -0.60  0.60 -0.11  0.78 -0.48 -0.50      
          role1:inference3   4.420   2.102    0.30 -0.30  0.05 -0.97  0.71  0.37 -0.90
 Residual                  553.987  23.537                                            
Number of obs: 3480, groups:  lfdn, 435 content, 20

Saya ingin mengetahui Koefisien Korelasi Intraclass (ICC) untuk peserta dan item. Berkat jawaban yang bagus ini saya pada prinsipnya tahu cara mendapatkan ICC untuk model saya. Namun, saya tidak yakin apakah termasuk lereng acak atau tidak:

vars <- lapply(summary(m_plot)$varcor, diag)
resid_var <- attr(summary(m_plot)$varcor, "sc")^2
total_var <- sum(sapply(vars, sum), resid_var)

# with random slopes
sapply(vars, sum)/total_var
##       lfdn    content 
## 0.33822396 0.09880349

# only random intercepts:
sapply(vars, function(x) x[1]) / total_var
##   lfdn.(Intercept) content.(Intercept) 
##         0.17496587          0.02425948 

Apa ukuran yang sesuai untuk korelasi antara dua tanggapan dari peserta yang sama masing-masing dengan item yang sama?

Henrik
sumber
1
Merlo et al 2005 "Tutorial konseptual singkat tentang analisis multilevel dalam epidemiologi sosial: menyelidiki fenomena kontekstual dalam kelompok orang yang berbeda" mungkin menjadi referensi yang bermanfaat.
N Brouwer
@ Henrik apakah Anda pernah menemukan jawaban untuk pertanyaan ini? Saya juga tertarik.
Patrick S. Forscher
2
@ PatrickS.Forscher Sejauh yang saya mengerti, ICC tidak masuk akal dengan lereng acak. Saya telah belajar ini dari Jake Westfall.
Henrik
Punya tautan ke bacaan yang relevan secara kebetulan?
Patrick S. Forscher
1
@ PatrickS.Forscher Seperti yang Anda lihat, Jake Westfall sekarang memberikan jawaban yang bagus.
Henrik

Jawaban:

8

Pada dasarnya tidak ada angka tunggal atau perkiraan yang dapat merangkum tingkat pengelompokan dalam model lereng acak.

Korelasi intra-kelas (ICC) hanya dapat ditulis sebagai proporsi varian sederhana dalam model acak-penyadapan saja. Untuk mengetahui alasannya, sketsa derivasi dari ekspresi ICC dapat ditemukan di sini .

Ketika Anda melempar lereng acak ke dalam persamaan model, mengikuti langkah-langkah yang sama sebagai gantinya mengarah ke ekspresi ICC pada halaman 5 makalah ini . Seperti yang Anda lihat, ekspresi rumit itu adalah fungsi dari prediktor X. Untuk melihat lebih intuitif mengapa var (Y) bergantung pada X ketika ada lereng acak, periksa halaman 30 slide ini ("Mengapa varians bergantung pada x ? ") .

Karena ICC adalah fungsi dari prediktor (nilai x), ia hanya dapat dihitung untuk set nilai x tertentu. Anda mungkin bisa mencoba sesuatu seperti melaporkan ICC pada rata-rata gabungan dari nilai-x, tetapi perkiraan ini akan terbukti tidak akurat untuk sebagian besar pengamatan.

Semua yang saya katakan masih hanya merujuk pada kasus di mana ada faktor acak tunggal. Dengan banyak faktor acak, ini menjadi semakin rumit. Misalnya, dalam proyek multi-situs di mana peserta di setiap situs menanggapi sampel rangsangan (yaitu, 3 faktor acak: situs, peserta, stimulus), kita dapat bertanya tentang banyak ICC yang berbeda: Apa korelasi yang diharapkan antara dua tanggapan di situs yang sama, ke stimulus yang sama, dari peserta yang berbeda? Bagaimana dengan di situs yang berbeda, stimulus yang sama, dan peserta yang berbeda? Dan seterusnya. @rvl menyebutkan komplikasi ini dalam jawaban yang ditautkan oleh OP.

Jadi seperti yang Anda lihat, satu-satunya kasus di mana kita dapat meringkas tingkat pengelompokan dengan nilai tunggal adalah kasus faktor-tunggal-acak-faktor-saja-acak. Karena ini adalah sebagian kecil dari kasus dunia nyata, ICCs tidak begitu berguna sepanjang waktu. Jadi rekomendasi umum saya adalah untuk tidak khawatir tentang mereka. Sebagai gantinya saya merekomendasikan hanya melaporkan komponen varians (lebih disukai dalam bentuk standar deviasi).

Jake Westfall
sumber