Menghitung pengulangan efek dari model lmer

28

Saya baru saja menemukan makalah ini , yang menjelaskan bagaimana menghitung pengulangan (alias reliabilitas, alias korelasi intraclass) dari pengukuran melalui pemodelan efek campuran. Kode R adalah:

#fit the model
fit = lmer(dv~(1|unit),data=my_data)

#obtain the variance estimates
vc = VarCorr(fit)
residual_var = attr(vc,'sc')^2
intercept_var = attr(vc$id,'stddev')[1]^2

#compute the unadjusted repeatability
R = intercept_var/(intercept_var+residual_var)

#compute n0, the repeatability adjustment
n = as.data.frame(table(my_data$unit))
    k = nrow(n)
    N = sum(n$Freq)
n0 = (N-(sum(n$Freq^2)/N))/(k-1)

#compute the adjusted repeatability
Rn = R/(R+(1-R)/n0)

Saya percaya bahwa pendekatan ini juga dapat digunakan untuk menghitung keandalan efek (yaitu jumlah efek kontras variabel dengan 2 level), seperti pada:

#make sure the effect variable has sum contrasts
contrasts(my_data$iv) = contr.sum

#fit the model
fit = lmer(dv~(iv|unit)+iv,data=my_data)

#obtain the variance estimates
vc = VarCorr(fit)
residual_var = attr(vc,'sc')^2
effect_var = attr(vc$id,'stddev')[2]^2

#compute the unadjusted repeatability
R = effect_var/(effect_var+residual_var)

#compute n0, the repeatability adjustment
n = as.data.frame(table(my_data$unit,my_data$iv))
k = nrow(n)
N = sum(n$Freq)
    n0 = (N-(sum(n$Freq^2)/N))/(k-1)

#compute the adjusted repeatability
Rn = R/(R+(1-R)/n0)

Tiga pertanyaan:

  1. Apakah perhitungan di atas untuk mendapatkan estimasi titik pengulangan efek masuk akal?
  2. Ketika saya memiliki beberapa variabel yang pengulangannya ingin saya perkirakan, menambahkan semuanya ke kesesuaian yang sama (misalnya lmer(dv~(iv1+iv2|unit)+iv1+iv2) tampaknya menghasilkan perkiraan pengulangan yang lebih tinggi daripada membuat model terpisah untuk setiap efek. Ini masuk akal secara komputasi bagi saya, karena dimasukkannya beberapa efek akan cenderung mengurangi varians residual, tetapi saya tidak yakin bahwa perkiraan pengulangan yang dihasilkan valid. Apakah mereka?
  3. Makalah yang dikutip di atas menunjukkan bahwa kemungkinan profiling dapat membantu saya mendapatkan interval kepercayaan untuk perkiraan pengulangan, tetapi sejauh yang saya tahu, confint(profile(fit))hanya menyediakan interval untuk varian intersep dan efek, sedangkan saya juga akan memerlukan interval untuk varians residual untuk menghitung interval untuk pengulangan, bukan?
Mike Lawrence
sumber

Jawaban:

6

Saya pikir saya bisa menjawab pertanyaan Anda setidaknya mengenai perkiraan pengulangan yang tidak disesuaikan , yaitu, korelasi intra-kelas klasik (ICC). Mengenai perkiraan pengulangan yang "disesuaikan", saya membaca sekilas kertas yang Anda tautkan dan tidak benar-benar melihat di mana rumus yang Anda gunakan dapat ditemukan di koran? Berdasarkan ekspresi matematis, nampaknya pengulangan skor rata-rata (bukan skor individu). Tetapi tidak jelas bahwa ini adalah bagian penting dari pertanyaan Anda, jadi saya akan mengabaikannya.

(1.) Apakah perhitungan di atas untuk mendapatkan estimasi titik pengulangan efek masuk akal?

Ya, ekspresi yang Anda usulkan memang masuk akal, tetapi sedikit modifikasi pada formula yang Anda usulkan diperlukan. Di bawah ini saya menunjukkan bagaimana seseorang dapat menurunkan koefisien pengulangan yang Anda usulkan. Saya harap ini memperjelas arti konseptual dari koefisien dan juga menunjukkan mengapa diinginkan untuk mengubahnya sedikit.

Untuk memulai, pertama mari kita ambil koefisien pengulangan dalam kasus pertama Anda dan klarifikasi apa artinya dan dari mana asalnya. Memahami ini akan membantu kita untuk memahami kasus kedua yang lebih rumit.

Hanya penyadapan acak

Dalam kasus ini, model campuran untuk tanggapan ke- dalam kelompok ke- adalah mana penyadapan acak memiliki varian dan residual memiliki varian .ij

yij=β0+u0j+eij,
u0jσu02eijσe2

Sekarang, korelasi antara dua variabel acak dan didefinisikan sebagai xy

corr=cov(x,y)var(x)var(y).

Ekspresi untuk ICC / koefisien pengulangan kemudian berasal dari membiarkan dua variabel acak dan menjadi dua pengamatan yang diambil dari kelompok sama , dan jika Anda menyederhanakan ini menggunakan definisi yang diberikan di atas dan properti varians / kovarian (proses yang tidak akan saya tunjukkan di sini, kecuali Anda atau orang lain lebih suka yang saya lakukan), Anda berakhir dengan xyj

ICC=cov(β0+u0j+ei1j,β0+u0j+ei2j)var(β0+u0j+ei1j)var(β0+u0j+ei2j),
ICC=σu02σu02+σe2.
Apa artinya ini adalah bahwa ICC atau "koefisien pengulangan yang tidak disesuaikan" dalam kasus ini memiliki interpretasi sederhana sebagai korelasi yang diharapkan antara pengamatan pasangan dari cluster yang sama (bersih dari efek tetap, yang dalam kasus ini hanya rata-rata besar). Fakta bahwa ICC juga dapat ditafsirkan sebagai proporsi varian dalam kasus ini adalah kebetulan; penafsiran itu tidak benar secara umum untuk ICC yang lebih rumit. Interpretasi sebagai semacam korelasi adalah yang utama.

Penyadapan acak dan lereng acak

Sekarang untuk kasus kedua, pertama-tama kita harus mengklarifikasi apa yang dimaksud dengan "keandalan efek (yaitu jumlah efek kontras variabel dengan 2 level)" - kata-kata Anda.

Pertama kita paparkan modelnya. Model campuran untuk tanggapan ke- dalam kelompok ke- bawah tingkat ke- dari prediktor berkode kontras adalah mana intersep acak memiliki varians , lereng acak memiliki varians , intersep acak dan lereng memiliki kovarians , dan residu memiliki varian .ijkx

yijk=β0+β1xk+u0j+u1jxk+eijk,
σu02σu12σu01eijσe2

Jadi apa "pengulangan efek" di bawah model ini? Saya pikir definisi kandidat yang baik adalah bahwa itu adalah korelasi yang diharapkan antara dua pasang skor perbedaan yang dihitung dalam cluster sama , tetapi di antara pasangan pengamatan yang berbeda .ji

Jadi pasangan skor selisih yang dimaksud adalah (ingat bahwa kami mengasumsikan adalah kode kontras sehingga ): dan x|x1|=|x2|=x

yi1jk2yi1jk1=(β0β0)+β1(xk2xk1)+(u0ju0j)+u1j(xk2xk1)+(ei1jk2ei1jk1)=2xβ1+2xu1j+ei1jk2ei1jk1
yi2jk2yi2jk1=2xβ1+2xu1j+ei2jk2ei2jk1.

Memasukkan ini ke dalam rumus korelasi memberi kita yang disederhanakan menjadi Perhatikan bahwa ICC secara teknis adalah fungsi dari ! Namun, dalam hal ini hanya dapat mengambil 2 nilai yang mungkin, dan ICC identik pada kedua nilai ini.

ICC=cov(2xβ1+2xu1j+ei1jk2ei1jk1,2xβ1+2xu1j+ei2jk2ei2jk1)var(2xβ1+2xu1j+ei1jk2ei1jk1)var(2xβ1+2xu1j+ei2jk2ei2jk1),
xx
ICC=2x2σu122x2σu12+σe2.
xx

Seperti yang Anda lihat, ini sangat mirip dengan koefisien pengulangan yang Anda usulkan dalam pertanyaan Anda, satu-satunya perbedaan adalah bahwa varians kemiringan acak harus diskalakan dengan tepat jika ekspresi tersebut harus ditafsirkan sebagai ICC atau "koefisien pengulangan yang tidak disesuaikan." Ekspresi yang Anda tulis bekerja dalam kasus khusus di mana prediktor dikodekan , tetapi tidak secara umum.± 1x±12

(2.) Ketika saya memiliki beberapa variabel yang pengulangannya ingin saya perkirakan, menambahkan semuanya ke kesesuaian yang sama (misalnya lmer(dv~(iv1+iv2|unit)+iv1+iv2) tampaknya menghasilkan perkiraan pengulangan yang lebih tinggi daripada membuat model terpisah untuk setiap efek. Ini masuk akal secara komputasi bagi saya, karena dimasukkannya beberapa efek akan cenderung mengurangi varians residual, tetapi saya tidak yakin bahwa perkiraan pengulangan yang dihasilkan valid. Apakah mereka?

Saya percaya bahwa bekerja melalui derivasi yang sama seperti yang disajikan di atas untuk model dengan beberapa prediktor dengan kemiringan acak mereka sendiri akan menunjukkan bahwa koefisien pengulangan di atas masih akan valid, kecuali untuk komplikasi tambahan bahwa skor perbedaan yang secara konseptual kita tertarik sekarang akan memiliki definisi yang sedikit berbeda: yaitu, kami tertarik pada korelasi yang diharapkan dari perbedaan antara rata-rata yang disesuaikan setelah mengendalikan prediktor lain dalam model.

Jika prediktor lain ortogonal dengan prediktor minat (seperti dalam, misalnya, percobaan yang seimbang), saya akan berpikir ICC / koefisien pengulangan yang diuraikan di atas harus bekerja tanpa modifikasi. Jika mereka tidak ortogonal maka Anda perlu memodifikasi rumus untuk memperhitungkan ini, yang bisa menjadi rumit, tetapi mudah-mudahan jawaban saya telah memberikan beberapa petunjuk tentang seperti apa itu.

Jake Westfall
sumber
Kamu benar Jake. ICC yang disesuaikan mengacu pada bagian VII. REPEATABILITAS DAN HERITABILITAS YANG DIEKSTRUKSI dalam makalah yang tertaut. Para penulis menulis Adalah penting untuk membedakan antara pengulangan pengukuran individu dan pengulangan pengukuran berartiR nRRn .
Gabra