Menurut ini artikel wikipedia , satu dapat mewakili produk probabilitas x⋅y
sebagai -log(x) - log(y)
membuat perhitungan lebih komputasi optimal. Tetapi jika saya mencoba sebuah contoh katakanlah:
p1 = 0.5
p2 = 0.5
p1 * p2 = 0.25
-log(p1) - log(p2) = 2
p3 = 0.1
p4 = 0.1
p3 * p4 = 0.01
-log(p3) - log(p4) = 6.64
Produk probabilitas p1
dan p2
lebih tinggi dari p3
dan p4
, tetapi probabilitas log lebih rendah.
Bagaimana bisa?
probability
logarithm
arithmetic
spacemonkey
sumber
sumber
Jawaban:
Saya khawatir Anda salah paham tentang apa maksud artikel itu. Ini bukan kejutan besar, karena agak tidak jelas ditulis. Ada dua hal berbeda yang terjadi.
Yang pertama adalah bekerja pada skala log.
Artinya, alih-alih " " (ketika Anda memiliki independensi), Anda dapat menulis " log ( p A B ) = log ( p A ) + log (pAB=pA⋅pB ". Jika Anda membutuhkan probabilitas yang sebenarnya, Anda dapat exponentiate di akhir untuk mendapatkan kembali p A B :log(pAB)=log(pA)+log(pB) pAB tetapi jika diperlukan sama sekali, eksponensial biasanya akan diserahkan ke langkah terakhir yang mungkin. Sejauh ini baik.pAB=elog(pA)+log(pB),
Bagian kedua adalah mengganti dengan - log p . Ini agar kami bekerja dengan nilai-nilai positif.logp −logp
Secara pribadi, saya tidak benar-benar melihat banyak nilai dalam hal ini, terutama karena ia membalikkan arah pemesanan apa pun ( meningkat monoton, jadi jika p 1 < p 2 , maka log ( p A ) < log ( p 2 ) ; ini order dibalik dengan - log p ).log p1<p2 log(pA)<log(p2) −logp
sumber