Untuk matriks biaya,
L=[010.50]c1c2predictionc1c2truth
hilangnya prediksi kelas ketika kebenarannya adalah kelas adalah , dan biaya prediksi kelas ketika kebenarannya adalah kelas adalah . Tidak ada biaya untuk prediksi yang benar, . Risiko bersyarat untuk memprediksi kedua kelas adalahc 2 L 12 = 0,5 c 2 c 1 L 21 = 1 L 11 = L 22 = 0 R kc1c2L12=0.5c2c1L21=1L11=L22=0Rk
R ( c1| x)R ( c2| x)= L11Pr ( c1| x)+ L12Pr ( c2| x)= L12Pr ( c2| x)= L22Pr ( c2| x)+ L21Pr ( c1| x)= L21Pr ( c1| x)
Untuk referensi lihat
catatan ini di halaman 15.
Untuk meminimalkan risiko / kerugian, Anda memprediksi jika biaya dari kesalahan melakukannya (itulah hilangnya prediksi yang salah kali probabilitas posterior bahwa prediksi itu salah ) adalah lebih kecil dari biaya salah memprediksi alternatif,L 12 Pr ( c 2 | x )c1L.12Pr ( c2| x)
Pr(c2|x)∝Pr(x|c2)Pr(c2)Pr(c1)=Pr(c2)=0,51
L.12Pr ( c2| x)L.12Pr ( x | c2) Pr ( c2)L.12Pr ( c2)L.21Pr ( c1)< L21Pr ( c1| x)< L21Pr ( x | c1) Pr ( c1)< Pr ( x | c1)Pr ( x | c2)
mana baris kedua menggunakan aturan Bayes ' . Dengan probabilitas sebelumnya yang sama dengan Anda mendapatkan
Pr(c2|x)∝Pr(x|c2)Pr(c2)Pr(c1)=Pr(c2)=0.512<Pr(x|c1)Pr(x|c2)
jadi Anda memilih untuk mengklasifikasikan pengamatan sebagai adalah rasio kemungkinan melebihi ambang batas ini. Sekarang tidak jelas bagi saya apakah Anda ingin tahu "ambang terbaik" dalam hal rasio kemungkinan atau dalam hal atribut . Jawabannya berubah sesuai dengan fungsi biaya. Menggunakan Gaussian dalam ketidaksetaraan dengan dan , ,
x σ 1 = σ 2 = σ μ 1 = 0 μ 2 = 1 1c1xσ1=σ2=σμ1=0μ2=1
12log(12)log(12)xσ2x<12π√σexp[−12σ2(x−μ1)2]12π√σexp[−12σ2(x−μ2)2]<log(12π−−√σ)−12σ2(x−0)2−[log(12π−−√σ)−12σ2(x−1)2]<−x22σ2+x22σ2−2x2σ2+12σ2<12σ2−log(12)<12−log(12)σ2
sehingga ambang prediksi dalam hal
xsaat Anda mencari hanya dapat dicapai jika kerugian dari prediksi salah adalah sama, yaitu karena hanya dengan itu Anda dapat memiliki dan Anda mendapatkan .
L12=L21log(L12L21)=log(1)=0x0<12