Saya mencoba untuk memahami apa tujuan dari fungsi kerugian dan saya tidak bisa memahaminya.
Jadi, sejauh yang saya mengerti fungsi kerugian adalah untuk memperkenalkan semacam metrik bahwa kita dapat mengukur "biaya" dari keputusan yang salah.
Jadi katakanlah saya memiliki dataset 30 objek, saya membaginya dengan set pelatihan / pengujian seperti 20 / 10. Saya akan menggunakan fungsi kerugian 0-1, jadi katakanlah set label kelas saya adalah M dan fungsinya terlihat seperti ini :
Jadi saya membangun beberapa model pada data pelatihan saya, katakanlah saya menggunakan classifier Naive Bayes, dan model ini mengklasifikasikan 7 objek dengan benar (memberi mereka label kelas yang benar) dan 3 objek diklasifikasikan dengan tidak benar.
Jadi fungsi kerugian saya akan mengembalikan "0" 7 kali dan "1" 3 kali - informasi apa yang bisa saya dapatkan dari itu? Bahwa model saya mengklasifikasikan 30% objek secara salah? Atau ada yang lebih dari itu?
Jika ada kesalahan dalam cara berpikir saya, saya sangat menyesal, saya hanya mencoba untuk belajar. Jika contoh yang saya berikan "terlalu abstrak", beri tahu saya, saya akan mencoba untuk lebih spesifik. Jika Anda akan mencoba menjelaskan konsep menggunakan contoh berbeda, silakan gunakan fungsi kerugian 0-1.
sumber
sumber
Saya pikir kebingungan Anda tidak membedakan kerugian untuk satu titik data vs kerugian untuk seluruh kumpulan data.
sumber