Saya punya masalah dengan 6 kelas. Jadi saya membangun classifier multiclass, sebagai berikut: untuk setiap kelas, saya memiliki satu classifier Logistic Regression, menggunakan One vs All, yang berarti saya memiliki 6 classifier yang berbeda.
Saya dapat melaporkan matriks kebingungan untuk masing-masing pengklasifikasi saya. Tapi, saya ingin melaporkan matriks kebingungan untuk SEMUA pengklasifikasi, seperti yang saya lihat dalam banyak contoh di sini.
Bagaimana saya bisa melakukannya? Apakah saya harus mengubah strategi klasifikasi saya, menggunakan algoritma Satu lawan Satu alih-alih Satu vs Semua? Karena pada matriks kebingungan ini, laporan mengatakan positif palsu untuk setiap kelas.
Contoh matriks kebingungan multi-kelas
Saya ingin mencari jumlah barang yang salah klasifikasi. Di baris pertama, ada 137 contoh kelas 1 yang diklasifikasikan sebagai kelas 1, dan 13 contoh kelas 1 yang diklasifikasikan sebagai kelas 2 . Bagaimana cara mendapatkan nomor ini?
Jawaban:
Agaknya, Anda menggunakan pengklasifikasi ini untuk membantu memilih satu kelas tertentu untuk satu set nilai fitur tertentu (seperti yang Anda katakan Anda sedang membuat classifier multiclass).
Jadi, katakanlah Anda memiliki kelas , maka matriks kebingungan Anda akan menjadi matriks , dengan sumbu kiri menunjukkan kelas yang benar (seperti yang dikenal dalam set uji) dan sumbu atas yang menunjukkan kelas yang ditugaskan ke item dengan kelas yang benar. Setiap elemen dari matriks akan menjadi jumlah item dengan kelas benar yang diklasifikasikan sebagai kelas .N × N iN N×N i,j i j
Ini hanyalah perpanjangan langsung dari matriks kebingungan 2-kelas.
sumber
Meskipun sudah ada beberapa jawaban di forum ini, saya pikir saya akan memberikan persamaan eksplisit untuk membuatnya lebih pasti:
Dengan asumsi Anda memiliki matriks kebingungan multi-kelas dari formulir,C=Actualc11⋮cn1Classifed...⋱c1ncnn
Elemen kebingungan untuk setiap kelas diberikan oleh:
sumber
Menggunakan matriks yang dilampirkan dalam pertanyaan dan mempertimbangkan nilai-nilai dalam sumbu vertikal sebagai kelas aktual, dan nilai-nilai dalam sumbu horizontal prediksi. Kemudian untuk Kelas 1:
137
-> sampel kelas 1, diklasifikasikan sebagai kelas 16
-> (1 + 2 + 4) sampel kelas 2, 3 dan 4, tetapi diklasifikasikan sebagai kelas 118
-> (13 + 3 + 1 + 1) sampel kelas 1, tetapi diklasifikasikan sebagai kelas 2, 3, 6 dan 7581
-> (55 + 1 + 6 ... + 2 + 26) Jumlah semua nilai dalam matriks kecuali yang ada di kolom 1 dan baris 1sumber