sumber
Tidak, ini bukan contoh overfitting! Ini akan overfitting jika kerugian yang valid mulai meningkat sementara kehilangan pelatihan akan berkurang.
Sunting: jawaban untuk pertanyaan kedua Layak mempertimbangkan bagaimana auc dihitung. Kami memiliki probabilitas masing-masing contoh milik kelas positif. Lalu kami mengurutkan probabilitas ini. Jika semua instance positif muncul di bagian pertama daftar yang diurutkan dan semua negatif ada di bagian kedua, maka auc adalah 1 ("kinerja sempurna" menurut pengamatan auc).
Sekarang mari kita pertimbangkan perhitungan kerugian. Misalnya entropi silang biner. Rumusnya adalah mana - label nyata, - probabilitas bahwa termasuk dalam kelas positif. Kita dapat memprediksi untuk setiap pengamatan negatif, bahwa probabilitasnya adalah 0,998, maka kerugian akan sangat besar. Tetapi jika probabilitas yang diprediksi untuk pengamatan positif adalah 0,999 (lebih tinggi daripada untuk negatif), maka dalam hal AUC kita akan memiliki kinerja yang sempurna.
Itu sebabnya saya kira, kita harus mengevaluasi kerugian.
Tidak, ini tidak cocok.
Pertama-tama AUC persis sama antara set kereta dan validasi. Kerugian mungkin memiliki celah tetapi karena kerugian validasi masih menurun (meskipun lambat) Anda OK.
sumber
Bagaimana dengan yang ini? Dalam hal itu, kerugian validasi meningkat tetapi AUC tidak mengikuti pola yang sama, yang mana yang dianggap kerugian atau kinerja?
sumber