Koefisien korelasi Matthews ( ) adalah ukuran untuk mengukur kualitas klasifikasi biner ([Wikipedia] [1]). diberikan untuk klasifikasi biner yang menggunakan true positive ( ), false positive ( ), false negative ( ), dan nilai true negative ( ) seperti yang diberikan di bawah ini:
Aku punya kasus di mana saya harus mengklasifikasikan tiga kelas yang berbeda, , , dan . Bisakah saya menerapkan formulasi di atas untuk menghitung untuk kasus multi-kelas setelah menghitung nilai , , , dan untuk setiap kelas seperti yang ditunjukkan di bawah ini?
Jawaban:
Ya, secara umum, Anda bisa. Pendekatan yang ingin Anda gunakan kadang-kadang disebut "Micro-Averaging": pertama, jumlah semua
TN
,FP
s, dll untuk setiap kelas, dan kemudian hitung statistik yang menarik.Cara lain untuk menggabungkan statistik untuk setiap kelas adalah dengan menggunakan apa yang disebut "Makro-Rata-Rata": di sini Anda pertama-tama menghitung statistik untuk masing-masing kelas (A vs bukan A, B vs bukan B, dll), lalu menghitung rata-rata dari mereka.
Anda dapat melihat di sini untuk beberapa detail tambahan. Halaman ini berbicara tentang Precision dan Recall, tapi saya percaya ini berlaku untuk koefisien Matthew serta statistik lain berdasarkan tabel kontingensi.
sumber
Teknik rata-rata makro bekerja dengan baik untuk presisi, sensitivitas, dan spesifisitas. Tetapi ketika saya mencobanya untuk PKS, hasilnya tidak sesuai. Untuk detail lebih lanjut tentang perhitungan MCC multi-kelas, lihat:
Kode berikut ini berfungsi untuk saya:
sumber
MCC dapat digunakan untuk Wikipedia klasifikasi biner dan multikelas dan ini diterapkan dalam pembelajaran sci-kit untuk label biner dan multikelas.
sumber
MCC dirancang untuk klasifikasi biner.
Jika Anda ingin mendapatkan pengukuran classifier yang serupa, Anda bisa mencoba Cohen Kappa, itu dapat diterapkan ke matriks kebingungan multi-kelas.
sumber