Fungsi biaya untuk Regresi Ordinal menggunakan jaringan saraf

Apa fungsi biaya terbaik untuk melatih jaringan saraf untuk melakukan regresi ordinal , yaitu untuk memprediksi hasil yang nilainya ada pada skala sewenang-wenang di mana hanya pemesanan relatif antara nilai yang berbeda adalah signifikan (misalnya: untuk memprediksi ukuran produk mana yang akan dipesan pelanggan : 'kecil' (kode 0), 'sedang' (kode 1), 'besar' (kode 2) atau 'ekstra besar' (kode 3))? Saya mencoba mencari tahu apakah ada alternatif yang lebih baik daripada kerugian kuadratik (memodelkan masalah sebagai regresi 'vanila') atau kehilangan lintas-entropi (memodelkan masalah sebagai klasifikasi).

neural-network cost-function xboard
sumber

Jawaban:

Pendekatan lain disarankan dalam makalah ini untuk estimasi usia wajah:

https://www.cv-foundation.org/openaccess/content_cvpr_2016/papers/Niu_Ordinal_Regression_With_CVPR_2016_paper.pdf

Orang-orang ini menggunakan sejumlah pengklasifikasi biner yang memprediksi apakah suatu titik data lebih besar dari ambang, dan melakukan ini untuk beberapa ambang batas. Yaitu dalam kasus Anda jaringan akan memiliki tiga output biner yang sesuai

lebih besar dari 0
lebih besar dari 1
lebih besar dari 2.

Misalnya, untuk 'besar (2)' kebenaran dasarnya adalah [1 1 0]. Fungsi biaya akhir adalah jumlah tertimbang dari fungsi biaya lintas-entropi individual untuk setiap classifier biner.

Ini memiliki keuntungan dari pembobotan kesalahan yang lebih besar secara inheren lebih banyak karena lebih banyak istilah entropi biaya individu akan dilanggar. Cukup melakukan klasifikasi kategoris dari hasil yang dipesan tidak secara inheren memiliki fitur ini.

Chrigi
sumber