Dalam pembelajaran mesin, kita dapat menggunakan area di bawah kurva ROC (sering disingkat AUC , atau AUROC) untuk merangkum seberapa baik suatu sistem dapat membedakan antara dua kategori. Dalam teori pendeteksian sinyal seringkali (indeks sensitivitas) digunakan untuk tujuan yang sama. Keduanya terhubung erat, dan saya percaya mereka setara satu sama lain jika asumsi tertentu dipenuhi .
Perhitungan biasanya disajikan berdasarkan asumsi distribusi normal untuk distribusi sinyal (lihat tautan wikipedia di atas, misalnya). Perhitungan kurva ROC tidak membuat asumsi ini: ini berlaku untuk klasifikasi apa pun yang menghasilkan kriteria keputusan bernilai terus menerus yang dapat di-threshold.
Wikipedia mengatakan bahwa setara dengan . Ini kelihatannya benar jika asumsi keduanya terpenuhi; tetapi jika asumsinya tidak sama, itu bukan kebenaran universal.
Apakah adil untuk menggambarkan perbedaan dalam asumsi sebagai "AUC membuat lebih sedikit asumsi tentang distribusi yang mendasarinya"? Atau sebenarnya hanya sebagai berlaku secara luas sebagai AUC, tapi itu hanya praktek umum bahwa orang yang menggunakan cenderung menggunakan perhitungan yang mengasumsikan distribusi normal? Adakah perbedaan lain dalam asumsi mendasar yang saya lewatkan?
sumber