Saya memiliki beberapa set data EEG yang saya uji terhadap dua kelas. Saya bisa mendapatkan tingkat kesalahan yang layak dari LDA (distribusi kelas-kondisional bukan Gaussian, tetapi memiliki ekor yang sama dan pemisahan yang cukup baik), jadi saya ingin memplot ROC dari prediktor LDA terhadap set data dari subjek lain.
Berikut adalah grafik khas untuk alat prediksi yang diuji terhadap satu uji coba:
Saya telah mencoba beberapa paket berbeda (pROC dan ROCR), dan hasilnya konsisten. Pertanyaan saya adalah, ada apa dengan siku yang tajam? Apakah itu hanya artefak dari proyeksi yang dihasilkan oleh LDA, yaitu, kebetulan ada 'tebing' di mana kinerja classifier merosot?
sumber
Meskipun pertanyaan ini diajukan sekitar 3 tahun yang lalu, saya merasa berguna untuk menjawabnya di sini setelah menemukan itu dan menjadi bingung untuk beberapa saat. Saat output ground truth Anda adalah 0,1 dan prediksi Anda adalah 0,1, Anda mendapatkan siku-siku. Jika prediksi atau kebenaran dasar Anda adalah nilai atau probabilitas kepercayaan diri (katakan dalam kisaran [0,1]), maka Anda akan mendapatkan siku lengkung.
sumber
Saya setuju dengan John, karena kurva yang tajam disebabkan oleh kelangkaan poin. Secara khusus, tampaknya Anda menggunakan prediksi biner model Anda (yaitu 1/0) dan label yang diamati (yaitu 1/0). Karena ini, Anda memiliki 3 poin, satu mengasumsikan cutoff Inf, satu mengasumsikan cutoff 0, dan yang terakhir mengasumsikan cutoff 1 yang diberikan kepada Anda oleh TPR dan FPR model Anda dan terletak pada sudut tajam di grafik Anda.
Sebagai gantinya, Anda harus menggunakan probabilitas dari kelas prediksi (nilai antara 0 dan 1) dan label yang diamati (yaitu 1/0). Ini kemudian akan memberi Anda sejumlah poin pada grafik yang sama dengan jumlah probabilitas unik yang Anda miliki (plus satu untuk Inf). Jadi, jika Anda memiliki 100 probabilitas unik, Anda akan 101 poin pada grafik untuk masing-masing dari berbagai cutoff.
sumber