menurut buku Dan Jurafsky dan James H. Martin :
"Namun ternyata, frekuensi sederhana bukanlah ukuran hubungan yang terbaik antara kata-kata. Satu masalah adalah frekuensi mentah sangat condong dan tidak terlalu diskriminatif. Jika kita ingin tahu jenis konteks apa yang dibagikan oleh aprikot dan nanas tetapi tidak dengan digital dan informasi, kita tidak akan mendapatkan diskriminasi yang baik dari kata-kata seperti itu, itu, atau mereka, yang sering terjadi dengan semua jenis kata dan tidak informatif tentang kata tertentu. "
terkadang kami mengganti frekuensi mentah ini dengan informasi timbal balik positif positif:
PPMI(w,c)=max(log2P(w,c)P(w)P(c),0)
PMI sendiri menunjukkan betapa mungkin untuk mengamati kata w dengan kata konteks C dibandingkan dengan mengamati mereka secara mandiri. Dalam PPMI kami hanya menyimpan nilai positif PMI. Mari kita pikirkan kapan PMI adalah + atau - dan mengapa kita hanya menyimpan yang negatif:
Apa arti PMI positif?
P( w , c )( P( w ) P( c ) )> 1
P( w , c ) > ( P( w ) P( c ) )
itu terjadi ketika dan terjadi saling lebih daripada secara individu seperti tendangan dan bola. Kami ingin menyimpan ini!wc
Apa arti PMI negatif?
P( w , c )( P( w ) P( c ) )< 1
P( w , c ) < ( P( w ) P( c ) )
itu berarti keduanya dan atau salah satunya cenderung terjadi secara individual! Ini mungkin menunjukkan statistik yang tidak dapat diandalkan karena data yang terbatas jika tidak, hal ini menunjukkan co-kejadian tidak informatif misalnya, 'the' and 'ball'. ('the' muncul dengan sebagian besar kata juga.)wc
PMI atau khususnya PPMI membantu kita menangkap situasi semacam itu dengan kejadian bersama yang informatif.