Saya telah melakukan klasifikasi menggunakan beberapa pengklasifikasi untuk data berlabel 2 kelas, dan saya menggunakan validasi silang 5 kali lipat. Untuk setiap lipatan saya menghitung tp, tn, fp, dan fn. Kemudian saya menghitung akurasi, ketepatan, daya ingat dan skor-F untuk setiap tes. Pertanyaan saya adalah, ketika saya ingin hasil rata-rata, saya mengambil rata-rata akurasi, tetapi dapatkah saya rata-rata presisi, mengingat dan F-skor juga? Atau apakah ini salah secara matematis? NB Dataset yang digunakan dalam setiap lipatan seimbang dalam hal jumlah instance per kelas.
Terima kasih.
Jawaban:
The -score, dengan asumsi Anda menggunakan definisi biasa, sudah merupakan kombinasi dari presisi dan recall. Secara khusus, itu adalah rata-rata harmonik dari mereka. Dengan kata lain Ini dimaksudkan untuk menangkap 'keefektifan' sistem di mana pengguna menempatkan bobot yang sama pada presisi dan daya ingat. Ada ekstensi, yang disebut skor , yang memberi kali lebih banyak bobot untuk diingat daripada presisi. Hidup sisi lain, jika Anda bertanya apakah Anda dapat rata-rata 5F
Perlu diketahui bahwa ada beberapa masalah dengan menggunakan nilai-nilai ini untuk membuat kesimpulan tentang kesalahan generalisasi pengklasifikasi. Misalnya, uji- antara skor untuk satu classifier dan skor untuk classifier lain akan terlalu optimis.t F F
sumber