Saya agak bingung mengenai koefisien korelasi intraclass dan ANOVA satu arah. Seperti yang saya pahami, keduanya memberi tahu Anda bagaimana pengamatan serupa dalam suatu kelompok, relatif terhadap pengamatan pada kelompok lain.
Bisakah seseorang menjelaskan ini sedikit lebih baik, dan mungkin menjelaskan situasi di mana masing-masing metode lebih menguntungkan?
Jawaban:
Kedua metode mengandalkan ide yang sama, yaitu menguraikan varian yang diamati menjadi bagian atau komponen yang berbeda. Namun, ada perbedaan halus dalam apakah kita menganggap barang dan / atau penilai sebagai efek tetap atau acak. Selain mengatakan bagian mana dari total variabilitas yang dijelaskan oleh faktor antara (atau seberapa banyak perbedaan antara menyimpang dari varians residual), uji-F tidak banyak bicara. Setidaknya ini berlaku untuk ANOVA satu arah di mana kami mengasumsikan efek tetap (dan yang sesuai dengan ICC (1,1) yang dijelaskan di bawah). Di sisi lain, ICC menyediakan indeks terikat ketika menilai keandalan peringkat untuk beberapa penilai yang "dapat ditukar", atau homogenitas di antara unit analitis.
Kami biasanya membuat perbedaan berikut antara berbagai jenis ICC. Ini mengikuti dari karya mani Shrout dan Fleiss (1979):
Ini sesuai dengan kasus 1 hingga 3 dalam Tabel 1. Perbedaan tambahan dapat dibuat tergantung pada apakah kami menganggap bahwa peringkat yang diamati adalah rata-rata dari beberapa peringkat (mereka disebut ICC (1, k), ICC (2, k), dan ICC (3, k)) atau tidak.
Singkatnya, Anda harus memilih model yang tepat (satu arah vs dua arah), dan ini sebagian besar dibahas dalam makalah Shrout dan Fleiss. Model satu arah cenderung menghasilkan nilai yang lebih kecil daripada model dua arah; juga, model efek acak umumnya menghasilkan nilai lebih rendah daripada model efek tetap. ICC yang berasal dari model efek tetap dianggap sebagai cara untuk menilai konsistensi penilai (karena kami mengabaikan varian penilai), sedangkan untuk model efek-acak kita berbicara tentang perkiraan perjanjian penilai (apakah penilai dapat dipertukarkan atau tidak). Hanya model dua arah yang menggabungkan interaksi subjek rater x, yang mungkin menarik ketika mencoba mengungkap pola peringkat yang tidak tipikal.
Ilustrasi berikut adalah salinan / tempel contoh dari
ICC()
dalam paket psik (data berasal dari Shrout dan Fleiss, 1979). Data terdiri dari 4 juri (J) dengan 6 subjek atau target (S) dan dirangkum di bawah ini (saya akan berasumsi bahwa data itu disimpan sebagai R matriks bernamasf
)Contoh ini menarik karena menunjukkan bagaimana pilihan model dapat mempengaruhi hasil, oleh karena itu interpretasi studi reliabilitas. Semua 6 model ICC adalah sebagai berikut (ini adalah Tabel 4 dalam makalah Shrout dan Fleiss)
Seperti dapat dilihat, mempertimbangkan penilai sebagai efek tetap (karenanya tidak mencoba untuk menggeneralisasi ke penampung penilai yang lebih luas) akan menghasilkan nilai yang jauh lebih tinggi untuk homogenitas pengukuran. (Hasil serupa dapat diperoleh dengan paket irr (
icc()
), meskipun kita harus bermain dengan opsi berbeda untuk tipe model dan unit analisis.)Apa yang dikatakan oleh pendekatan ANOVA kepada kita? Kita perlu mencocokkan dua model untuk mendapatkan kotak mean yang relevan:
Tidak perlu melihat F-test, hanya MS yang menarik di sini.
Sekarang, kita dapat mengumpulkan potongan-potongan yang berbeda dalam Tabel ANOVA diperpanjang yang terlihat seperti yang ditunjukkan di bawah ini (ini adalah Tabel 3 di kertas Shrout dan Fleiss):
(sumber: mathurl.com )
di mana dua baris pertama berasal dari model satu arah, sedangkan dua yang berikutnya berasal dari ANOVA dua arah.
Sangat mudah untuk memeriksa semua formula dalam artikel Shrout dan Fleiss, dan kami memiliki semua yang kami butuhkan untuk memperkirakan keandalan untuk penilaian tunggal . Bagaimana dengan reliabilitas untuk rata-rata penilaian berganda (yang sering kali adalah jumlah minat dalam studi antar-penilai)? Mengikuti Hays dan Revicki (2005), ini dapat diperoleh dari dekomposisi di atas dengan hanya mengubah total MS yang dipertimbangkan dalam penyebut, kecuali untuk model dua arah efek acak yang mana kita harus menulis ulang rasio MS.
Sekali lagi, kami menemukan bahwa keandalan keseluruhan lebih tinggi ketika mempertimbangkan penilai sebagai efek tetap.
Referensi
sumber