Bagaimana saya bisa menghitung AUC dari kurva ROC untuk klasifikasi?

8

Berdasarkan TPR dan FPR, saya telah menghasilkan kurva ROC untuk model klasifikasi biner saya. Saya tidak tahu, bagaimana cara menghitung nilai AUC. Saya akan sangat membantu saya jika Anda dapat membantu saya menghitung nilai AUC.

Rejaul Karim
sumber
Terima kasih atas jawaban anda. Adakah yang bisa membantu saya dengan menjelaskan dengan contoh sederhana?
Rejaul Karim
Di mana tepatnya Anda sedang bermasalah?
Aditya

Jawaban:

4

Selamat datang di komunitas!

Seperti yang Anda ketahui, AUC hanyalah area di bawah kurva ROC. Jadi pertanyaannya lebih tentang metode numerik karena Anda memiliki satu set poin dan Anda ingin menghitung area di bawahnya.

Riemannian Sum

Solusi sepele. Cukup buat persegi panjang dari titik yang Anda miliki. Area masing-masing persegi panjang adalah produk tepi. Kemudian jumlahkan mereka! Anda mungkin tidak suka kan ?!

Metode Trapesium

Setelah Riemannian, algoritma paling sederhana dan paling naif untuk melakukan ini. Anda hanya memiliki satu set poin dan Anda hanya menghitung area trapesium antara masing-masing pasangan dan jumlah mereka seperti apa yang Anda lihat pada gambar di bawah ini. Ini memiliki kesalahan perhitungan maksimum karena menyederhanakan banyak masalah.

masukkan deskripsi gambar di sini

Metode Simpson (1/3)

Jauh lebih baik ketika kita berbicara tentang kurva! Mari kita tetap sederhana dan to the point. Anda dapat memodelkan fungsi Anda di setiap interval menggunakan kuadratik (y=Sebuahx2+bx+c) dan memiliki 3 titik data. Dengan menggunakan tiga titik data Anda, Anda dapat menghitungSebuah, b dan c. Maka area di bawah kurva tidak terlalu sulit, tetapi kami memiliki solusi yang lebih baik! Percayalah atau tidak, nilai integrasi ini sederhana

b-Sebuah6(f(Sebuah)+4×f(m)+f(b))

dimana (Sebuah,f(Sebuah)) dan (b,f(b)) adalah titik akhir interval dan (m,f(m))adalah titik tengahnya. Lihat gambar di bawah dari sini untuk membandingkan metode ini.

masukkan deskripsi gambar di sini

Metode Romberg

Metode simpson dan / atau trapesium dapat diterapkan secara rekursif untuk mencapai perhitungan yang lebih akurat. Ini disebut metode Romberg . Keakuratan metode-metode ini berada pada interval yang panjang. Interval yang lebih kecil memberikan integrasi yang lebih akurat. Romberg menggunakan fakta ini untuk secara iteratif mendekati jawaban yang lebih akurat.

Dan tentu saja nada algoritma lebih banyak untuk melakukan itu.

PS: Anda tentu memiliki perpustakaan dan fungsi dalam berbagai bahasa untuk menghitungnya untuk Anda. Scipy menawarkan untuk Python misalnya .

Semoga ini bisa membantu! Semoga berhasil!

Kasra Manshaei
sumber
Saya senang itu membantu :)
Kasra Manshaei