Statistik Kappa ( ) diperkenalkan pada tahun 1960 oleh Cohen [1] untuk mengukur kesepakatan antara dua penilai. Perbedaannya, bagaimanapun, telah menjadi sumber kontradiksi untuk beberapa waktu.
Pertanyaan saya adalah tentang perhitungan varians mana yang terbaik untuk digunakan dengan sampel besar. Saya cenderung percaya bahwa yang diuji dan diverifikasi oleh Fleiss [2] akan menjadi pilihan yang tepat, tetapi ini tampaknya bukan satu-satunya yang diterbitkan yang tampaknya benar (dan digunakan di seluruh literatur yang cukup baru).
Saat ini saya memiliki dua cara konkret untuk menghitung varians sampel besar asimptotiknya:
- Metode yang diperbaiki diterbitkan oleh Fleiss, Cohen dan Everitt [2];
- Metode delta yang dapat ditemukan dalam buku oleh Colgaton, 2009 [4] (halaman 106).
Untuk mengilustrasikan beberapa kebingungan ini, berikut adalah kutipan oleh Fleiss, Cohen dan Everitt [2], penekanan pada saya:
Banyak usaha manusia telah dikutuk dengan kegagalan berulang sebelum keberhasilan akhir dicapai. Penskalaan Gunung Everest adalah salah satu contohnya. Penemuan Northwest Passage adalah yang kedua. Derivasi dari kesalahan standar yang benar untuk kappa adalah yang ketiga .
Jadi, inilah ringkasan kecil dari apa yang terjadi:
- 1960: Cohen menerbitkan makalahnya "Koefisien kesepakatan untuk skala nominal" [1] memperkenalkan ukuran kesepakatan yang diperbaiki secara kebetulan antara dua penilai yang disebut . Namun, ia menerbitkan formula yang salah untuk perhitungan varians.
- 1968: Everitt mencoba untuk memperbaikinya, tetapi formulanya juga salah.
- 1969: Fleiss, Cohen dan Everitt menerbitkan formula yang benar di koran "Contoh Besar Kesalahan Standar Kappa dan Weighted Kappa" [2]
- 1971: Fleiss menerbitkan statistik lain (tetapi yang berbeda) dengan nama yang sama, dengan formula yang salah untuk varians.
- 1979: Fleiss Nee dan Landis menerbitkan formula yang diperbaiki untuk Fleiss ' .
Pada awalnya, perhatikan notasi berikut. Notasi ini menyiratkan operator penjumlahan harus diterapkan ke semua elemen dalam dimensi di mana titik ditempatkan:
Sekarang, seseorang dapat menghitung Kappa sebagai:
Di mana
adalah perjanjian yang diamati, dan
adalah perjanjian kebetulan.
Sejauh ini, perhitungan varian yang benar untuk Cohen diberikan oleh:
dan di bawah hipotesis nol itu diberikan oleh:
Metode Congalton tampaknya didasarkan pada metode delta untuk mendapatkan varian (Agresti, 1990; Agresti, 2002); Namun saya tidak yakin apa metode delta itu atau mengapa itu harus digunakan. The varians, dengan metode ini, diberikan oleh:
di mana
(Congalton menggunakan subskrip daripada , Tetapi tampaknya berarti hal yang sama. Selain itu, saya mengandaikan bahwa harus menjadi matriks penghitungan, yaitu matriks kebingungan sebelum dibagi dengan jumlah sampel sebagai terkait dengan rumus )
Bagian aneh lainnya adalah bahwa buku Colgaton tampaknya merujuk pada makalah asli oleh Cohen, tetapi tampaknya tidak mengutip koreksi terhadap varian Kappa yang diterbitkan oleh Fleiss et al, tidak sampai ia melanjutkan untuk membahas Kappa tertimbang. Mungkin publikasi pertamanya ditulis ketika formula asli untuk kappa masih hilang dalam kebingungan?
Apakah ada yang bisa menjelaskan mengapa perbedaan itu? Atau mengapa seseorang menggunakan varians metode delta alih-alih versi yang diperbaiki oleh Fleiss?
[1]: Fleiss, Joseph L.; Cohen, Yakub; Everitt, BS; Sampel besar kesalahan standar kappa dan kappa tertimbang. Buletin Psikologis, Vol 72 (5), November 1969, 323-327. doi: 10.1037 / h0028106
[2]: Cohen, Jacob (1960). Koefisien kesepakatan untuk skala nominal. Pengukuran Pendidikan dan Psikologis 20 (1): 37–46. DOI: 10.1177 / 001316446002000104.
[3]: Alan Agresti, Analisis Data Kategorikal, edisi ke-2. John Wiley and Sons, 2002.
[4]: Russell G. Congalton dan Green, K .; Menilai Keakuratan Data Sensed Remote: Prinsip dan Praktek, edisi ke-2. 2009
Jawaban:
Saya tidak tahu mana dari dua cara untuk menghitung varians yang lebih disukai tetapi saya bisa memberi Anda cara ketiga, praktis dan berguna untuk menghitung interval kepercayaan / kredibel dengan menggunakan estimasi Bayesian dari Cohen Kappa.
Kode R dan JAGS di bawah ini menghasilkan sampel MCMC dari distribusi posterior nilai kredibel Kappa yang diberikan data.
Plot di bawah ini menunjukkan plot kerapatan sampel MCMC dari distribusi posterior Kappa.
Menggunakan sampel MCMC kita sekarang dapat menggunakan nilai median sebagai perkiraan Kappa dan menggunakan 2,5% dan 97,5% kuantil sebagai interval kepercayaan / kredibilitas 95%.
Bandingkan ini dengan perkiraan "klasik" yang dihitung menurut Fleiss, Cohen dan Everitt:
Secara pribadi saya lebih suka interval kepercayaan Bayesian daripada interval kepercayaan klasik, terutama karena saya percaya interval kepercayaan Bayesian memiliki sifat sampel kecil yang lebih baik. Masalah umum yang cenderung dimiliki orang dengan analisis Bayesian adalah bahwa Anda harus menentukan keyakinan sebelumnya mengenai distribusi parameter. Untungnya, dalam hal ini, mudah untuk membangun prior "objektif" dengan hanya meletakkan distribusi seragam di semua parameter. Ini harus membuat hasil model Bayesian sangat mirip dengan perhitungan "klasik" dari koefisien Kappa.
Referensi
Sanjib Basu, Mousumi Banerjee dan Ananda Sen (2000). Bayesian Inference for Kappa dari Studi Tunggal dan Berganda. Biometrik , Vol. 56, No. 2 (Juni, 2000), hlm. 577-582
sumber