Deskripsi Masalah
Saya memulai konstruksi jaringan untuk masalah yang menurut saya bisa memiliki fungsi kerugian yang jauh lebih mendalam daripada regresi MSE sederhana.
Masalah saya berkaitan dengan klasifikasi multi-kategori ( lihat pertanyaan saya di SO untuk apa yang saya maksudkan dengan ini), di mana ada jarak atau hubungan yang ditentukan antara kategori yang harus diperhitungkan.
Poin lain adalah bahwa kesalahan tidak boleh dipengaruhi oleh jumlah kategori tembak yang ada. Yaitu kesalahan untuk 5 kategori menembak masing-masing sebesar 0,1, harus sama dengan 1 kategori menembakkan sebesar 0,1. (dengan menembakkan maksud saya bahwa mereka tidak nol, atau di atas ambang batas tertentu)
Poin-poin penting
- klasifikasi multi-kategori (multiple firing sekaligus)
- hubungan antar kategori
- hitungan kategori menembak tidak boleh menimbulkan kerugian:
Percobaan saya
Mean Squared Error sepertinya tempat yang baik untuk memulai:
Ini hanya mempertimbangkan kategori demi kategori, yang masih berharga dalam masalah saya tetapi melewatkan sebagian besar gambar.
Ini adalah usaha saya untuk memperbaiki ide jarak antar kategori. Selanjutnya saya ingin memperhitungkan jumlah kategori yang ditembakkan ( sebut saja: v )
Pertanyaan saya
Saya memiliki latar belakang statistik yang sangat lemah; akibatnya, saya tidak memiliki banyak alat di ikat pinggang saya untuk memulai masalah seperti ini. Topik utama dari apa yang saya tanyakan adalah "Ketika membentuk fungsi biaya, bagaimana cara mengkombinasikan beberapa ukuran biaya? Atau teknik apa yang dapat diterapkan untuk melakukannya?" . Saya juga akan menghargai jika ada kekurangan dalam proses pemikiran saya diekspos dan diperbaiki.
Saya menghargai diajarkan mengapa kesalahan saya adalah kesalahan, bukan karena seseorang hanya memperbaikinya tanpa penjelasan.
Jika ada pertanyaan yang kurang jelas atau tidak dapat diperbaiki, beri tahu saya.
sumber
Jawaban:
Anda dapat menggunakan kerugian engsel yang merupakan batas atas pada kerugian klasifikasi; yaitu, ia menghukum model jika label kategori penilaian tertinggi berbeda dari label kelas kebenaran-tanah.
Untuk detail lebih lanjut tentang hubungan antara kehilangan klasifikasi dan kehilangan engsel, Anda dapat membaca Bagian 2 dari makalah luar biasa ini dari CNJ Yu dan T. Joachims.
Singkatnya, ada kehilangan tugas , biasanya dilambangkan denganΔ(yi,y^(xi)) , Yang mengukur penalti untuk memprediksi output y^(xi) untuk input xi ketika output (ground-truth) yang diharapkan adalah yi . Hilangnya tugas untuk klasifikasi multi-kelas biasanya didefinisikan sebagaiΔ(yi,y^(xi))=1{yi≠y^(xi)} . Namun, asalkanΔ hanya tergantung pada dua label y dan y^ , Anda dapat mendefinisikannya sesuka Anda. Secara khusus, orang dapat melihatΔ sebagai sewenang-wenang K×K matriks dimana K adalah jumlah kategori dan Δ(a,b) menunjukkan penalti mengklasifikasikan input kategori a sebagai milik kategori b .
Sebagai contoh:input data:{(x1,y1),(x2,y2),(x3,y3)},xi∈Rd,yi∈Y={c1,c2,c3,c4}network predictions:y^(x1)=c2,y^(x2)=c1,y^(x3)=c3task loss matrix:⎡⎣⎢⎢⎢⎢Δ(y1,y1)Δ(y2,y1)Δ(y3,y1)Δ(y4,y1)Δ(y1,y2)Δ(y2,y2)Δ(y3,y2)Δ(y4,y2)Δ(y1,y3)Δ(y2,y3)Δ(y3,y3)Δ(y4,y3)Δ(y1,y4)Δ(y2,y4)Δ(y3,y4)Δ(y4,y4)⎤⎦⎥⎥⎥⎥=⎡⎣⎢⎢⎢0123101221013210⎤⎦⎥⎥⎥classification loss assuming y1=c4,y2=c1,y3=c4:Δ(y1,y^(x1))=Δ(c4,c2)=2Δ(y2,y^(x2))=Δ(c1,c1)=0Δ(y3,y^(x3))=Δ(c4,c3)=1
sumber