Saya telah melakukan kompetisi pembelajaran mesin di mana mereka menggunakan RMSLE (Root Mean Squared Logarithmic Error) untuk mengevaluasi kinerja memprediksi harga jual suatu kategori peralatan. Masalahnya adalah saya tidak yakin bagaimana menafsirkan keberhasilan hasil akhir saya.
Sebagai contoh jika saya mencapai RMSLE dari bisa saya membesarkannya yang eksponensial kekuatan dan menafsirkannya seperti RMSE? (mis. )?e e 1,052 = 2,863 = R M S E
Bisakah saya kemudian mengatakan bahwa prediksi saya adalah rata-rata dari harga yang sebenarnya? Atau adakah cara yang lebih baik untuk menafsirkan metrik? Atau bisakah metrik itu ditafsirkan sama sekali dengan pengecualian membandingkan dengan RMSLE lain dari model lain?
Jawaban:
Saya belum pernah melihat RMSLE sebelumnya, tapi saya berasumsi itu .1N∑Ni = 1( log( xsaya) - log( ysaya) )2---------------------√
Jadi eksponensial itu tidak akan memberi Anda RMSE, itu akan memberi Anda
Jika kita mengambil log dari kedua sisi, kita mendapatkan RMSLE versus , yang jelas bukan hal yang sama.12log( 1N∑Ni = 1( xsaya- ysaya)2)
Sayangnya, tidak ada hubungan mudah yang baik secara umum (meskipun seseorang lebih pintar dariku / memikirkannya lebih sulit daripada aku mungkin bisa menggunakan ketidaksetaraan Jensen untuk mencari tahu hubungan di antara keduanya).
Ini, tentu saja, RMSE dari variabel log-transformed, untuk apa nilainya. Jika Anda ingin rasa kasar dari distribusi, Anda bisa mendapatkan rasa kasar dari penyebaran logaritma mereka, sehingga RMSLE dari 1,052 berarti bahwa "rata-rata" adalah kali lebih besar dari nilai sebenarnya, atau 1 / 2.86. Tentu saja bukan itu yang dimaksud dengan RMSE ....2.86
sumber
Saya tidak tahu apakah ada interpretasi generik langsung, bahkan menganalisis kasus tertentu.
Misalnya, Anda mungkin tertarik untuk mengevaluasi kesalahan apa yang akan terjadi jika Anda memprediksi semua kasus dengan nilai rata-rata dan membandingkannya dengan pendekatan Anda.
Bagaimanapun, saya percaya RMSLE biasanya digunakan ketika Anda tidak ingin menghukum perbedaan besar dalam nilai yang diprediksi dan benar ketika nilai yang diprediksi dan benar adalah angka yang sangat besar. Dalam kasus ini hanya perbedaan persentasi yang penting karena Anda dapat menulis ulang
Misalnya untuk P = 1000 dan A = 500 akan memberi Anda kesalahan yang kira-kira sama seperti ketika P = 100000 dan A = 50000.
sumber
sumber
Ada cara tidak langsung untuk mengukur kinerja fungsi kerugian dalam hal sesuatu yang lebih mudah dimengerti, meskipun tidak akan secara langsung mengkonversi nilai seperti yang Anda harapkan.
Setelah model telah dilatih dan diuji menggunakan RMSLE, cukup ambil metrik baru. Hanya karena model tersebut dilatih pada RMSLE, itu tidak berarti Anda tidak dapat mengambil fungsi kerugian lainnya yang lebih dimengerti sebagai metrik.
Dalam Keras, misalnya, Anda dapat menentukan fungsi kerugian tambahan dalam kategori metrik dalam kompiler model. Di bawahnya MSLE digunakan untuk melatih model (Setara dengan RMSLE), tetapi MAE dan MSE juga dicatat:
sumber