Saya mengerti bahwa ukuran-f (berdasarkan presisi dan daya ingat) adalah perkiraan seberapa akurat classifier. Juga, f-ukuran lebih disukai daripada akurasi ketika kita memiliki dataset yang tidak seimbang. Saya punya pertanyaan sederhana (yang lebih banyak tentang menggunakan terminologi yang benar daripada tentang teknologi). Saya memiliki dataset yang tidak seimbang dan saya menggunakan ukuran-f dalam percobaan saya. Saya akan menulis makalah yang BUKAN untuk konferensi pembelajaran mesin / data mining. Oleh karena itu, dapatkah saya merujuk pada f-ukur secara sinonim dengan akurasi dalam konteks ini. Misalnya, saya memiliki ukuran-f 0,82, maka dapatkah saya mengatakan bahwa classifier saya mencapai prediksi akurat 82%?
11
Jawaban:
Pertama-tama, saya menemukan "akurasi" kadang-kadang agak menyesatkan, karena merujuk pada hal-hal yang berbeda:
Istilah akurasi dalam genal untuk mengevaluasi sistem atau metode (saya ahli kimia analitik) mengacu pada bias prediksi, yaitu menjawab pertanyaan seberapa baik prediksi rata-rata.
Seperti yang Anda ketahui, ada banyak ukuran kinerja berbeda yang menjawab berbagai aspek kinerja untuk pengklasifikasi. Salah satunya kebetulan disebut akurasi juga. Jika makalah Anda bukan untuk audiens pembelajaran mesin / klasifikasi, saya sarankan untuk membuat perbedaan ini sangat jelas. Bahkan untuk makna akurasi yang lebih spesifik ini, saya akan sangat eksplisit tentang apa yang saya sebut akurasi karena sekali lagi beberapa cara untuk mengatasi ketidakseimbangan kelas dapat terjadi. Biasanya, ketidakseimbangan kelas diabaikan, yang mengarah ke perhitungan . Namun, Anda juga dapat menggunakan rata-rata sensitivitas dan spesifisitas, yang berarti mengendalikan ketidakseimbangan kelas dengan memberi bobot rata-rata.TP+ TNa l l c a s e s
The F-skor sering diperkenalkan sebagai mean harmonik presisi dan recall (atau nilai prediktif positif dan sensitivitas). Untuk pertanyaan Anda, saya pikir sangat membantu untuk menjelaskannya sedikit lebih jauh dan menyederhanakannya:
Ungkapan terakhir bukanlah sebagian kecil dari apa pun yang dapat saya pikirkan sebagai kelompok kasus uji tertentu. Secara khusus, tumpang tindih (berat) antara kasus TRUE dan POSITIF diharapkan. Ini akan membuat saya tidak menyatakan skor-F sebagai persentase seperti jenis yang menyiratkan proporsi kasus. Sebenarnya, saya pikir saya akan memperingatkan pembaca bahwa F-score tidak memiliki interpretasi seperti itu.
sumber
Jawaban cepat:
Tidak,
F-measure
rumus tidak terdiri dariTN
faktor, dan itu berguna saat mengambil masalah (doc) .Dengan demikian, ini (
F-measure
) pendekatan yang tepat untuk mengevaluasi dataset yang tidak seimbang atau dalam kasus pengambilan masalah alih-alihaccuracy
danROC
.[ CATATAN ]:
sumber