Pertimbangkan matriks input dan output biner .
Cara umum untuk mengukur kinerja classifier adalah dengan menggunakan kurva ROC.
Dalam plot ROC, diagonal adalah hasil yang akan diperoleh dari classifier acak. Dalam hal output tidak seimbang , kinerja classifier acak dapat ditingkatkan dengan memilih atau dengan probabilitas berbeda.
Bagaimana kinerja classifier seperti itu diwakili dalam plot kurva ROC? Saya kira itu harus menjadi garis lurus dengan sudut yang berbeda, dan bukan diagonal lagi?
Jawaban:
Kurva ROC tidak sensitif terhadap keseimbangan kelas. Garis lurus yang Anda dapatkan untuk pengelompokan acak sekarang sudah merupakan hasil dari menggunakan berbagai probabilitas menghasilkan positif (0 membawa Anda ke (0, 0) dan 1 membawa Anda ke (1, 1) dengan kisaran di antara setiap).
Tidak ada yang berubah dalam pengaturan yang tidak seimbang.
sumber