Bounding informasi mutual diberikan batasan pada informasi mutual pointwise

18

Misalkan saya memiliki dua set dan dan distribusi probabilitas gabungan atas set ini . Misalkan dan menunjukkan distribusi marginal lebih dari dan masing-masing.XYp(x,y)p(x)p(y)XY

Informasi timbal balik antara dan didefinisikan sebagai: XY

I(X;Y)=x,yp(x,y)log(p(x,y)p(x)p(y))

yaitu itu adalah nilai rata-rata dari pmi information mutual pointwise .(x,y)log(p(x,y)p(x)p(y))

Misalkan saya tahu batas atas dan bawah pada pmi : yaitu saya tahu bahwa untuk semua yang berikut ini berlaku: -k \ leq \ log \ kiri (\ frac {p (x, y)} {p ( x) p (y)} \ kanan) \ leq k(x,y)x,y

klog(p(x,y)p(x)p(y))k

Apa batas atas ini menyiratkan pada I(X;Y) . Tentu saja itu menyiratkan I(X;Y)k , tapi saya ingin ikatan yang lebih ketat jika memungkinkan. Ini tampaknya masuk akal bagi saya karena p mendefinisikan distribusi probabilitas, dan pmi (x,y) tidak dapat mengambil nilai maksimumnya (atau bahkan menjadi tidak negatif) untuk setiap nilai x dan y .

Florian
sumber
1
Ketika probabilitas gabungan dan marginal seragam, pmi ( x , y ) seragam nol (dan karena itu tidak negatif, tampaknya bertentangan dengan pernyataan terakhir Anda, tetapi hanya nyaris). Sepertinya saya, jika saya tidak salah, bahwa mengganggu situasi ini pada himpunan bagian kecil X×Y menunjukkan bahwa batas pada pmi hampir tidak mengatakan apa-apa tentang I(X;Y) itu sendiri.
whuber
1
Bahkan, jika X dan Y adalah independen, maka pmi(x,y) adalah konstan, terlepas dari distribusi marjinal. Jadi ada seluruh kelas distribusi p(x,y) yang pmi(x,y) memperoleh nilai maksimum untuk setiap x dan y .
kardinal
Ya, memang benar bahwa pmi dapat sama untuk semua dan , tetapi itu tidak mengesampingkan batas yang lebih ketat. Sebagai contoh, tidak sulit untuk membuktikan bahwa . Ini adalah ketika , dan merupakan penguatan non-sepele dari terikat ketika . Saya bertanya-tanya apakah ada batas non-sepele yang berlaku lebih umum. x y I ( X ; Y ) k ( e k - 1 ) k 2 k < 1 k k < 1(x,y)xyI(X;Y)k(ek1)k2k<1kk<1
Florian
1
Saya ragu Anda akan mendapatkan batas yang lebih baik daripada untuk . Jika Anda ingin terlihat lebih keras, coba ulang framing pertanyaan Anda dalam hal perbedaan KL antara p (x) p (y) dan p (x, y). Ketidaksetaraan Pinsker memberikan batas bawah pada MI yang mungkin mengkonfirmasi dugaan saya. Lihat juga Bagian 4 dari ajmaa.org/RGMIA/papers/v2n4/relog.pdf . k 0O(k2)k0
vqv

Jawaban:

5

Kontribusi saya terdiri dari contoh. Ini mengilustrasikan beberapa batasan tentang bagaimana informasi timbal balik dapat diberikan batasan pada informasi timbal balik pointwise.

Ambil dan untuk semua . Untuk setiap biarkan menjadi solusi untuk persamaan Kemudian kita menempatkan titik massa di titik di ruang produk sedemikian rupa sehingga ada dari titik-titik ini di setiap baris dan setiap kolom. (Ini dapat dilakukan dengan beberapa cara. Mulai, misalnya, dengan poin pertama di baris pertama dan kemudian isi baris yang tersisa dengan menggeserp ( x ) = 1 / n x X m { 1 , , n / 2 } k > 0 m e k + ( n - m ) e - k = n . e k / n 2, n } 2X=Y={1,,n}p(x)=1/nxXm{1,,n/2}k>0

mek+(nm)ek=n.
ek/n2{ 1 ,nm{1,,n}2m m e - k / n 2 n 2 - n m n mmmmmenunjuk satu ke kanan dengan syarat batas siklik untuk setiap baris). Kami menempatkan massa titik di sisa poin. Jumlah dari massa titik ini adalah sehingga mereka memberikan ukuran probabilitas. Semua probabilitas titik marginal adalah sehingga distribusi marjinal keduanya seragam.ek/n2n2nmm
nmn2ek+n2nmn2ek=mek+(nm)ekn=1,
mn2ek+mnn2ek=1n,

Dengan konstruksi jelas bahwa untuk semua , dan (setelah beberapa perhitungan) dengan informasi timbal balik berperilaku sebagai untuk dan sebagai untuk .pmi(x,y){k,k},x,y{1,,n}

I(X;Y)=knmn2ekkn2nmn2ek=k(1ekekek(ek+ek)ek),
k2/2k0kk

NRH
sumber
1

Saya tidak yakin apakah ini yang Anda cari, karena sebagian besar aljabar dan tidak benar-benar memanfaatkan properti p sebagai distribusi probabilitas, tetapi di sini ada sesuatu yang bisa Anda coba.

Karena batasan pada pmi, jelas dan dengan demikian . Kita dapat mengganti di untuk mendapatkanp(x,y)p(x)p(y)ekhal(x,y)hal(x)hal(y)ekhal(x,y)saya(X;Y)I(X;Y)x,yp(x)p(y)eklog(p(x)p(y)ekp(x)p(y))=x,yp(x)p(y)ekk

Saya tidak yakin apakah itu membantu atau tidak.

EDIT: Setelah ditinjau lebih lanjut, saya yakin ini sebenarnya kurang bermanfaat daripada batas atas asli k. Saya tidak akan menghapus ini kalau-kalau itu mungkin mengisyaratkan pada titik awal.

Michael McGowan
sumber
Nilai dari batas ini menjadi jelas setelah Anda mencatat dan (karena ) bahwa . x,yp(x)p(y)=1k0ek1
whuber
Ya, ketika saya menyadari bahwa saya membuat edit saya.
Michael McGowan