Andrew More mendefinisikan perolehan informasi sebagai:
di mana adalah entropi bersyarat . Namun, Wikipedia menyebut informasi timbal balik kuantitas di atas .
Wikipedia di sisi lain mendefinisikan perolehan informasi sebagai divergensi Kullback-Leibler (alias divergensi informasi atau entropi relatif) antara dua variabel acak:
di mana didefinisikan sebagai entropi silang .
Kedua definisi ini tampaknya tidak konsisten satu sama lain.
Saya juga melihat penulis lain berbicara tentang dua konsep terkait tambahan, yaitu entropi diferensial dan perolehan informasi relatif.
Apa definisi atau hubungan yang tepat antara jumlah-jumlah ini? Apakah ada buku teks yang bagus yang mencakup semuanya?
- Keuntungan informasi
- Informasi timbal balik
- Entropi silang
- Entropi bersyarat
- Entropi diferensial
- Perolehan informasi relatif
information-theory
Amelio Vazquez-Reina
sumber
sumber
Jawaban:
Saya pikir bahwa menyebut divergensi Kullback-Leibler "perolehan informasi" adalah tidak standar.
Definisi pertama adalah standar.
EDIT: Namun, juga dapat disebut saling informasi.H(Y)−H(Y|X)
Perhatikan bahwa saya tidak berpikir Anda akan menemukan disiplin ilmu yang benar-benar memiliki skema penamaan standar, tepat, dan konsisten. Jadi, Anda harus selalu melihat formula, karena umumnya akan memberi Anda ide yang lebih baik.
Buku teks: lihat "Pengantar yang bagus ke berbagai jenis entropi" .
Juga: Cosma Shalizi: Metode dan Teknik Ilmu Sistem Kompleks: Tinjauan, bab 1 (hlm. 33--114) dalam Thomas S. Deisboeck dan J. Yasha Kresh (eds.), Ilmu Sistem Kompleks di Biomedicine http: // arxiv.org/abs/nlin.AO/0307015
Robert M. Gray: Teori Entropi dan Informasi http://ee.stanford.edu/~gray/it.html
David MacKay: Teori Informasi, Inferensi, dan Algoritma Pembelajaran http://www.inference.phy.cam.ac.uk/mackay/itila/book.html
juga, "Apa itu" entropi dan perolehan informasi "?"
sumber
Kullback-Leiber Divergence antara dan sama dengan informasi timbal balik, yang dapat dengan mudah diturunkan:p(X,Y) P(X)P(Y)
Catatan:p(y)=∑xp(x,y)
sumber
Informasi timbal balik dapat didefinisikan menggunakan Kullback-Liebler sebagai
sumber
Mengekstraksi informasi timbal balik dari dataset tekstual sebagai fitur untuk melatih model pembelajaran mesin: (tugasnya adalah untuk memprediksi usia, jenis kelamin dan kepribadian blogger)
sumber
Kedua definisi itu benar, dan konsisten. Saya tidak yakin apa yang Anda temukan tidak jelas karena Anda menunjukkan beberapa poin yang mungkin perlu klarifikasi.
Pertama : adalah semua nama yang berbeda untuk hal yang sama. Dalam konteks yang berbeda, salah satu nama ini mungkin lebih disukai, saya akan menyebutnya di sini Informasi .MIMutualInformation≡ IGInformationGain≡IInformation
The kedua titik adalah hubungan antara perbedaan Kullback-Leibler - , dan Informasi . Divergensi Kullback-Leibler hanyalah ukuran ketidaksamaan antara dua distribusi. The Informasi dapat didefinisikan dalam hal ini distribusi ketidaksamaan (lihat Yters' respon). Jadi informasi adalah kasus khusus , di mana diterapkan untuk mengukur perbedaan antara distribusi gabungan aktual dari dua variabel (yang menangkap ketergantungan mereka ) dan distribusi gabungan hipotetis dari variabel yang sama, apakah mereka harus menjadi mandiri . Kami menyebutnya kuantitas ituDKL KLD KLD Informasi .
The ketiga titik untuk mengklarifikasi tidak konsisten, meskipun standar notasi yang digunakan, yaitu bahwa adalah baik notasi untuk Joint entropi dan Cross-entropi juga.H(X,Y)
Jadi, misalnya, dalam definisi Informasi : di kedua baris terakhir, adalah entropi bersama . Ini mungkin tampak tidak konsisten dengan definisi di halaman Informasi gain : tetapi Anda tidak gagal untuk mengutip klarifikasi penting - digunakan di sana sebagai salibI(X;Y)≡H(X)−H(X|Y)≡H(Y)−H(Y|X)≡H(X)+H(Y)−H(X,Y)≡H(X,Y)−H(X|Y)−H(Y|X) H(X,Y) DKL(P||Q)=H(P,Q)−H(P) H(P,Q) -entropy (seperti halnya juga di halaman lintas entropi ).
Joint -entropy dan Cross -entropy TIDAK sama.
Lihat ini dan ini di mana notasi ambigu ini dibahas dan notasi unik untuk lintas-entropi ditawarkan -Hq(p)
Saya berharap notasi ini diterima dan halaman wiki diperbarui.
sumber