Saat ini saya sedang melatih jaringan saraf dan saya tidak bisa memutuskan mana yang akan digunakan untuk menerapkan kriteria Berhenti Awal saya: kehilangan validasi atau metrik seperti akurasi / f1ccore / auc / apa pun yang dihitung pada set validasi.
Dalam penelitian saya, saya menemukan artikel yang membela kedua sudut pandang tersebut. Keras tampaknya default untuk kehilangan validasi tetapi saya juga menemukan jawaban yang meyakinkan untuk pendekatan yang berlawanan (misalnya di sini ).
Adakah yang memiliki arahan tentang kapan harus menggunakan lebih baik kehilangan validasi dan kapan harus menggunakan metrik tertentu?
cross_entropy
kerugian adalah kandidat yang lebih disukai daripadaMSE
atauMAE
. Lihat bagian Wrap-Up dari artikel ini , dan posting ini pada statistik .Menurut pendapat saya, ini subjektif dan masalah khusus. Anda harus menggunakan apa pun yang merupakan faktor terpenting dalam pikiran Anda sebagai metrik mengemudi, karena ini mungkin membuat keputusan Anda tentang bagaimana mengubah model yang lebih baik fokus.
Sebagian besar metrik yang dapat dihitung akan dikorelasikan / serupa dalam banyak hal: mis. Jika Anda menggunakan MSE untuk kerugian Anda, lalu merekam MAPE (rata-rata persentase kesalahan) atau kerugian sederhana , mereka akan memberi Anda kurva kehilangan yang sebanding.L.1
Misalnya, jika Anda akan melaporkan skor-F1 dalam laporan Anda / ke bos Anda, dll. (Dan dengan asumsi itulah yang benar-benar mereka pedulikan), maka menggunakan metrik itu akan sangat masuk akal. Skor F1, misalnya, memperhitungkan ketepatan dan penarikan kembali, yakni skor menggambarkan hubungan antara dua metrik berbutir halus .
Menyatukan semuanya, menghitung skor selain kerugian normal mungkin bagus untuk tinjauan umum dan untuk melihat bagaimana metrik akhir Anda dioptimalkan selama program iterasi pelatihan. Hubungan itu mungkin bisa memberi Anda wawasan yang lebih dalam tentang masalah tersebut,
Namun, biasanya yang terbaik adalah mencoba beberapa opsi, karena mengoptimalkan kehilangan validasi dapat memungkinkan pelatihan berjalan lebih lama, yang pada akhirnya juga dapat menghasilkan skor F1 yang superior . Ketepatan dan daya ingat mungkin bergoyang di sekitar beberapa minimum lokal, menghasilkan skor F1 yang hampir statis - sehingga Anda akan berhenti berlatih. Jika Anda telah mengoptimalkan kerugian murni, Anda mungkin telah mencatat fluktuasi kerugian yang cukup untuk memungkinkan Anda berlatih lebih lama.
sumber
Jika Anda melatih jaringan yang dalam, saya sangat menyarankan Anda untuk tidak menggunakan pemberhentian awal. Dalam pembelajaran yang mendalam, itu tidak terlalu lazim. Sebagai gantinya, Anda dapat menggunakan teknik lain seperti putus sekolah untuk generalisasi dengan baik. Jika Anda bersikeras itu, memilih kriteria tergantung pada tugas Anda. Jika Anda memiliki data yang tidak seimbang, Anda harus menggunakan
F1
skor dan mengevaluasinya pada data validasi silang Anda. Jika Anda memiliki data yang seimbang, coba gunakan akurasi pada data validasi silang Anda. Teknik lain sangat tergantung pada tugas Anda.Saya sangat menyarankan Anda untuk menemukan model yang sesuai dengan data Anda dengan baik dan mempekerjakan drop out setelah itu. Ini adalah hal yang paling biasa digunakan orang untuk model yang mendalam.
sumber