Jika adalah distribusi probabilitas dengan nilai bukan nol pada , untuk tipe apa ada konstanta sehingga untuk semua?
Ketidaksamaan di atas sebenarnya adalah Kullback-Leibler Divergence antara distribusi dan versi terkompresi . Saya telah menemukan bahwa ketidaksetaraan ini berlaku untuk distribusi Exponential, Gamma, dan Weibull dan saya tertarik untuk mengetahui apakah itu berfungsi untuk kelas yang lebih besar dari distribusi probabilitas.
Adakah yang tahu apa arti ketimpangan itu?
Jawaban:
Persiapan
Menulis
Logaritma dan hubungan antara dan menyarankan untuk mengekspresikan dan argumennya sebagai eksponensial. Untuk itu, tentukanp ( x ( 1 + ϵ ) ) pp(x) p(x(1+ϵ)) p
untuk semua nyata yang sisi kanannya didefinisikan dan sama dengan dimanapun . Perhatikan bahwa perubahan variabel memerlukan dan (menganggap sebagai kepadatan distribusi) sehingga Hukum Total Probabilitas dapat dinyatakan sebagai- ∞ p ( e yy −∞ x = e y d x = e y d y pp(ey)=0 x=ey dx=eydy p
Mari kita asumsikan saat .eq(y)+y→0 y→±∞ p 0 ∞ p ( 1 ) Ini mengesampingkan distribusi probabilitas dengan banyak lonjakan kepadatan di dekat atau . Secara khusus, jika ekor pada akhirnya monoton, menyiratkan asumsi ini, menunjukkan itu bukan yang parah.p 0 ∞ p (1)
Untuk membuat bekerja dengan logaritma lebih mudah, amati juga
Karena perhitungan berikut akan dilakukan hingga kelipatan dari , tentukanϵ2
Kita juga dapat mengganti dengan , dengan sesuai dengan dan positif berhubungan dengan positif .1+ϵ δ = 0 ϵ = 0 δ ϵeδ δ=0 ϵ=0 δ ϵ
Analisis
Salah satu cara yang jelas di mana ketimpangan dapat gagal adalah untuk integral untuk menyimpang untuk beberapa . Ini akan terjadi jika, misalnya, harus ada setiap interval yang tepat dari angka positif, tidak peduli seberapa kecil, di mana adalah identik nol tetapi tidak nol pada interval .Itu akan menyebabkan integand menjadi tak terbatas dengan probabilitas positif.ϵ∈(0,1]Ip(ϵ) ϵ∈(0,1] p p [ u - ϵ , v - ϵ ][u,v] p p [u−ϵ,v−ϵ]
Karena pertanyaannya tidak spesifik mengenai sifat , kita bisa terjebak dalam masalah teknis mengenai seberapa halus . Mari kita hindari masalah-masalah seperti itu, masih berharap untuk mendapatkan beberapa wawasan, dengan mengasumsikan bahwa mana-mana memiliki turunan sebanyak yang mungkin ingin kita gunakan. (Dua akan cukup jika kontinu.) Karena jaminan tetap terikat pada set terikat apa pun, itu menyiratkan bahwa tidak pernah nol ketika .p qp p q q p ( x ) x > 0q′′ q p(x) x>0
Perhatikan bahwa pertanyaan tersebut benar-benar menyangkut perilaku karena mendekati nol dari atas. Karena integral ini adalah fungsi kontinu dari dalam interval , ia mencapai beberapa maksimum ketika dibatasi untuk setiap interval positif , memungkinkan kita untuk memilih , karena jelasϵϵ(0,1] M p (a)ϵ[a,1]c= M pIp(ϵ) ϵ ϵ (0,1] Mp(a) ϵ [a,1] c ϵ 2 = M p ( a ) ( ϵc=Mp(a)/a2
membuat ketidaksetaraan bekerja. Inilah mengapa kita hanya perlu memerhatikan modulo penghitungan .ϵ2
Larutan
Dengan menggunakan perubahan variabel dari ke , dari ke , dan ke , mari kita menghitung melalui urutan kedua dalam (atau ) dengan harapan dapat mencapai penyederhanaan. Untuk itu tentukany p qx y p q ϵ δ Ip(ϵ) ϵ δ
menjadi urutan- sisanya dalam ekspansi Taylor dari sekitar .2 q y
Mengubah variabel ke di integral kiri menunjukkan itu harus menghilang, seperti yang dinyatakan dalam asumsi berikut . Mengubah variabel kembali ke di integral kanan memberiq(y)+y (1) x=ey
Ketimpangan berlaku (di bawah berbagai asumsi teknis kami) jika dan hanya jika koefisien di sisi kanan terbatas.δ2
Penafsiran
Ini adalah titik yang baik untuk berhenti, karena tampaknya mengungkap masalah penting: dibatasi oleh fungsi kuadrat dari tepatnya ketika kesalahan kuadratik dalam ekspansi Taylor dari tidak meledak (relatif terhadap distribusi) sebagai pendekatan .Ip(ϵ) ϵ q y ±∞
Mari kita periksa beberapa kasus yang disebutkan dalam pertanyaan: distribusi Exponential dan Gamma. (Eksponensial adalah kasus khusus dari Gamma.) Kita tidak perlu khawatir tentang parameter skala, karena mereka hanya mengubah satuan pengukuran. Hanya parameter non-skala yang penting.
Di sini, karena untuk , Ekspansi Taylor di sekitar sembarang adalahTeorema Taylor dengan Remainder menyiratkan didominasi oleh untuk cukup kecil . Karena ekspektasi adalah terbatas, ketidaksetaraan berlaku untuk distribusi Gamma.p(x)=xke−x k>−1
Perhitungan serupa menyiratkan ketidaksetaraan untuk distribusi Weibull, distribusi Half-Normal, distribusi Lognormal, dll. Bahkan, untuk mendapatkan contoh tandingan kita perlu melanggar setidaknya satu asumsi, memaksa kita untuk melihat distribusi di mana menghilang pada beberapa interval, atau apakah tidak dua kali terus menerus dapat dibedakan, atau memiliki banyak mode yang tak terhingga. Ini adalah tes mudah untuk diterapkan pada keluarga distribusi mana pun yang biasa digunakan dalam pemodelan statistik.p
sumber