Saya menemukan istilah kebingungan yang mengacu pada probabilitas invers log-rata pada data yang tidak terlihat. Artikel Wikipedia tentang kebingungan tidak memberikan makna intuitif untuk hal yang sama.
Ukuran kebingungan ini digunakan dalam kertas pLSA .
Adakah yang bisa menjelaskan kebutuhan dan makna intuitif dari ukuran kebingungan ?
measurement
perplexity
Pelajar
sumber
sumber
Jawaban:
Anda telah melihat artikel Wikipedia tentang kebingungan . Ini memberikan kebingungan distribusi diskrit sebagai
yang juga bisa ditulis sebagai
yaitu sebagai rata-rata geometri tertimbang dari invers probabilitas. Untuk distribusi kontinu, jumlah tersebut akan berubah menjadi integral.
Artikel ini juga memberikan cara memperkirakan kebingungan untuk model menggunakan buah data ujiN
yang juga bisa ditulis
atau dalam berbagai cara lain, dan ini harus membuatnya lebih jelas dari mana "probabilitas invers log-rata" berasal.
sumber
Saya menemukan ini agak intuitif:
http://planspace.org/2013/09/23/perplexity-what-it-is-and-what-yours-is/
sumber
Saya juga bertanya-tanya. Penjelasan pertama tidak buruk, tetapi di sini ada 2 nats saya untuk apa pun yang layak.
Pertama-tama, kebingungan tidak ada hubungannya dengan mengkarakterisasi seberapa sering Anda menebak sesuatu dengan benar. Ini lebih berkaitan dengan mengkarakterisasi kompleksitas urutan stokastik.
Kami sedang melihat kuantitas,2−∑xp(x)log2p(x)
Pertama-tama mari kita batalkan log dan eksponensial.
Saya pikir ada baiknya menunjukkan bahwa kebingungan adalah invarian dengan basis yang Anda gunakan untuk mendefinisikan entropi. Jadi dalam hal ini, kebingungan jauh lebih unik / kurang sewenang-wenang daripada entropi sebagai ukuran.
Hubungan dengan Dadu
Mari kita bermain dengan ini sedikit. Katakanlah Anda hanya melihat koin. Ketika koin itu adil, entropi maksimum, dan kebingungan maksimum11212×1212=2
Sekarang apa yang terjadi ketika kita melihat dadu berpihakN ? Bingung adalah 1(1N1N)N=N
Jadi kebingungan mewakili jumlah sisi dadu yang adil yang ketika digulung, menghasilkan urutan dengan entropi yang sama dengan distribusi probabilitas yang Anda berikan.
Jumlah Negara
Jadi, ketika Anda membuat membuat satu sisi dadu semakin tidak mungkin, kebingungan akhirnya tampak seolah-olah sisi itu tidak ada.
sumber
Untuk menjelaskan, kebingungan distribusi X seragam hanya | X |, jumlah elemen. Jika kita mencoba menebak nilai yang akan diambil sampel Iid dari distribusi seragam X dengan hanya membuat tebakan id dari X, kita akan benar 1 / | X | = 1 / kebingungan waktu. Karena distribusi seragam adalah nilai yang paling sulit ditebak, kita dapat menggunakan 1 / kebingungan sebagai perkiraan batas / heuristik yang lebih rendah untuk seberapa sering tebakan kita benar.
sumber