Pertanyaan yang diberi tag loss-functions

Fungsi yang digunakan untuk mengukur perbedaan antara data yang diamati dan nilai prediksi menurut model. Meminimalkan fungsi kerugian adalah cara untuk memperkirakan parameter model.

36
Machine Learning: Haruskah saya menggunakan entropi silang kategoris atau kehilangan entropi silang biner untuk prediksi biner?

Pertama-tama, saya menyadari jika saya perlu melakukan prediksi biner, saya harus membuat setidaknya dua kelas melalui melakukan satu-hot-encoding. Apakah ini benar? Namun, apakah binary cross entropy hanya untuk prediksi dengan hanya satu kelas? Jika saya menggunakan kerugian entropi lintas...

32
Fungsi biaya dalam regresi linier OLS

Saya agak bingung dengan kuliah tentang regresi linier yang diberikan oleh Andrew Ng pada Coursera tentang pembelajaran mesin. Di sana, ia memberikan fungsi biaya yang meminimalkan jumlah kuadrat sebagai: 12 m∑i = 1m( hθ( X( i )) - Y( i ))212m∑saya=1m(hθ(X(saya))-Y(saya))2 \frac{1}{2m} \sum...

31
Fungsi kerugian mana yang benar untuk regresi logistik?

Saya membaca tentang dua versi fungsi kerugian untuk regresi logistik, mana yang benar dan mengapa? Dari Machine Learning , Zhou ZH (dalam bahasa Cina), dengan :β= ( w , b )  dan  βTx = wTx + bβ=(w,b) and βTx=wTx+b\beta = (w, b)\text{ and }\beta^Tx=w^Tx +b l ( β) = ∑i = 1m( -ysayaβTxsaya+ ln( 1...

29
Cara menangani data hierarkis / bersarang dalam pembelajaran mesin

Saya akan menjelaskan masalah saya dengan sebuah contoh. Misalkan Anda ingin memprediksi penghasilan seseorang yang diberikan beberapa atribut: {Usia, Jenis Kelamin, Negara, Wilayah, Kota}. Anda memiliki dataset pelatihan seperti itu train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3),...

25
Gradien kehilangan Engsel

Saya mencoba menerapkan gradient descent dasar dan saya mengujinya dengan fungsi kehilangan engsel yaitu . Namun, saya bingung tentang gradien kehilangan engsel. Saya mendapat kesan bahwa itu adalahlengsel= maks ( 0 , 1 - y x ⋅ w )lengsel=maks(0,1-y x⋅w)l_{\text{hinge}} = \max(0,1-y\...

23
Apa fungsi kerugian SVM hard margin?

max(0,1−yi(w⊺xi+b))max(0,1−yi(w⊺xi+b))\max(0,1-y_i(w^\intercal x_i+b))12∥w∥2+C∑imax(0,1−yi(w⊺xi+b))12‖w‖2+C∑imax(0,1−yi(w⊺xi+b)) \frac{1}{2}\|w\|^2+C\sum_i\max(0,1-y_i(w^\intercal x_i+b)) ∥w∥2‖w‖2\|w\|^2max(0,1−yi(w⊺xi+b))max(0,1−yi(w⊺xi+b))\max(0,1-y_i(w^\intercal x_i+b)) Namun, untuk SVM hard...