Dalam beberapa kompetisi yang luar biasa, penilaian didasarkan pada "logloss". Ini berkaitan dengan kesalahan klasifikasi.
Inilah jawaban teknis tetapi saya mencari jawaban yang intuitif. Saya sangat menyukai jawaban atas pertanyaan ini tentang jarak Mahalanobis, tetapi PCA tidak logloss.
Saya dapat menggunakan nilai yang dikeluarkan oleh perangkat lunak klasifikasi saya, tetapi saya tidak benar-benar memahaminya. Mengapa kita menggunakannya daripada benar / salah positif / negatif? Bisakah Anda membantu saya agar saya bisa menjelaskan hal ini kepada nenek saya atau seorang pemula di lapangan?
Saya juga suka dan setuju dengan kutipan:
Anda tidak benar-benar memahami sesuatu kecuali Anda bisa menjelaskannya kepada nenek Anda
- Albert Einstein
Saya mencoba menjawab ini sendiri sebelum memposting di sini.
Tautan yang menurut saya tidak intuitif atau sangat membantu termasuk:
- http://www.r-bloggers.com/making-sense-of-logarithmic-loss/
- https://www.quora.com/What-is-an-intuitive-explanation-for-the-log-loss-function
- https://lingpipe-blog.com/2010/11/02/evaluating-with-probabilistic-truth-log-loss-vs-0-1-loss/
- https://www.kaggle.com/wiki/LogarithmicLoss
Ini informatif, dan akurat. Mereka dimaksudkan untuk audiens teknis. Mereka tidak menggambar sederhana, atau memberikan contoh sederhana dan mudah diakses. Mereka tidak ditulis untuk nenek saya.
sumber
Jawaban:
Logloss adalah logaritma produk dari semua probabilitas. Misalkan Alice meramalkan:
Ternyata Mary tidak menikah dengan John, Bill bukan pembunuh, tetapi John membunuh Jack. Produk probabilitas, menurut Alice, adalah 0,2 * 0,999 * 0,99 = 0,197802
Bob memperkirakan:
Produk ini 0,5 * 0,5 * 0,5 = 0,125.
Alice adalah prediktor yang lebih baik daripada Bob.
sumber