Karena saya memiliki dataset yang sangat tidak seimbang (hasil positif 9%), saya memutuskan kurva presisi-recall lebih tepat daripada kurva ROC. Saya memperoleh ukuran ringkasan analog dari area di bawah kurva PR (0,49, jika Anda tertarik) tetapi tidak yakin bagaimana menafsirkannya. Saya pernah mendengar bahwa 0,8 atau di atas adalah AUC yang baik untuk ROC, tetapi apakah cutoff umum akan sama untuk AUC untuk kurva presisi-recall?
sumber
0,49 tidak bagus, tetapi interpretasinya berbeda dari ROC AUC. Untuk ROC AUC, jika Anda memperoleh 0,49 menggunakan model regresi logistik, saya akan mengatakan Anda melakukan tidak lebih baik daripada acak. Untuk .49 PR AUC, namun mungkin tidak seburuk itu. Saya akan mempertimbangkan melihat presisi individu dan mengingat, mungkin satu atau yang lain adalah apa yang mendorong PR AUC Anda. Ingat akan memberi tahu Anda berapa banyak dari kelas positif 9% yang Anda duga itu benar. Presisi akan memberi tahu Anda berapa banyak yang Anda duga positif. (Positif Salah). 50% recall akan menjadi buruk artinya Anda tidak menebak-nebak banyak kelas yang tidak seimbang, tetapi mungkin presisi 50% tidak buruk. Tergantung pada situasi Anda.
sumber
Estimator acak akan memiliki PR-AUC 0,09 dalam kasus Anda (9% hasil positif), jadi 0,49 Anda jelas merupakan peningkatan yang substansial.
Jika ini adalah hasil yang baik, hanya dapat dinilai dalam perbandingan dengan algoritma lain, tetapi Anda tidak memberikan detail tentang metode / data yang Anda gunakan.
Selain itu, Anda mungkin ingin menilai bentuk kurva PR Anda. Kurva PR ideal bergerak dari sudut topleft secara horizontal ke sudut kanan atas dan lurus ke bawah ke sudut kanan bawah, menghasilkan PR-AUC 1. Dalam beberapa aplikasi, kurva PR menunjukkan sebaliknya lonjakan yang kuat di awal dengan cepat turun lagi dekat dengan "garis penduga acak" (garis horizontal pada ketelitian 0,09 dalam kasus Anda). Ini akan menunjukkan deteksi yang baik dari hasil positif "kuat", tetapi kinerja buruk pada kandidat yang kurang jelas.
Jika Anda ingin menemukan ambang batas yang baik untuk parameter cutoff algoritme Anda, Anda dapat mempertimbangkan titik pada kurva PR yang paling dekat dengan sudut kanan atas. Atau bahkan lebih baik, pertimbangkan validasi silang jika memungkinkan. Anda mungkin mencapai nilai presisi dan recall untuk parameter cutoff spesifik yang lebih menarik untuk aplikasi Anda daripada nilai PR-AUC. AUC paling menarik ketika membandingkan berbagai algoritma.
sumber