Distribusi probabilitas khusus

12

Jika p(x) adalah distribusi probabilitas dengan nilai bukan nol pada [0,+) , untuk tipe p(x) apa ada konstanta c>0 sehingga 0p(x)logp(x)(1+ϵ)p(x(1+ϵ))dxcϵ2untuk semua0<ϵ<1?

Ketidaksamaan di atas sebenarnya adalah Kullback-Leibler Divergence antara distribusi p(x) dan versi terkompresi (1+ϵ)p(x(1+ϵ)) . Saya telah menemukan bahwa ketidaksetaraan ini berlaku untuk distribusi Exponential, Gamma, dan Weibull dan saya tertarik untuk mengetahui apakah itu berfungsi untuk kelas yang lebih besar dari distribusi probabilitas.

Adakah yang tahu apa arti ketimpangan itu?

Sus20200
sumber
3
Karena ϵ positif yang akan dikompresi (dalam arah x) daripada diregangkan.
Glen_b -Reinstate Monica
2
Pertanyaan ini ambigu: apa bilangan Anda? Apakah Anda ingin ketidaksamaan ini berlaku untuk semua , setidaknya satu ϵ , atau yang lainnya? Apakah c diberikan apriori atau yang Anda maksud harus ada ada setidaknya satu nilai seperti dari c ? Dan karena Anda menyebutkan kelas distribusi probabilitas, dengan " p ( x ) " apakah maksud Anda satu distribusi tertentu atau apakah Anda mungkin bermaksud keluarga parametrik dari mereka? ϵ ϵccp(x)
whuber
2
@whuber Terima kasih atas komentar Anda. Saya mengoreksi pernyataan masalah saya untuk mengklarifikasi masalah yang disebutkan. Maksud saya, untuk apa ketidaksetaraan di atas berlaku? Jawabannya mungkin memperkenalkan keluarga distribusi parametrik atau mengusulkan persamaan diferensial untuk p ( x ) yang mencukupi dan memberikan ketimpangan yang diinginkan. p(x)p(x)
Sus20200
2
Tidakkah ketimpangan ini bekerja untuk p (x) apa pun yang berkelanjutan dan dengan dukungan tak terbatas? Anda menghitung divergensi KL di dalam keluarga parametrik ( . Jika KL dapat dibedakan pada 0, maka turunannya adalah 0. Mengambil C untuk menjadi maksimum kelengkungan KL (untuk ϵ [ 0 , 1 ] ), kita memiliki ikatan. Dengan pekerjaan tambahan, dimungkinkan untuk mengikat C dari sifat-sifat pϵp(x(1+ϵ))Cϵ[0,1]
Guillaume Dehaene
1
L ϵ + O ( ϵ 2 )L=limx0p(x)x=0Lϵ+O(ϵ2)

Jawaban:

4

Persiapan

Menulis

Ip(ϵ)=0p(x)log(p(x)(1+ϵ)p(x(1+ϵ)))dx.

Logaritma dan hubungan antara dan menyarankan untuk mengekspresikan dan argumennya sebagai eksponensial. Untuk itu, tentukanp ( x ( 1 + ϵ ) ) pp(x)p(x(1+ϵ))p

q(y)=log(p(ey))

untuk semua nyata yang sisi kanannya didefinisikan dan sama dengan dimanapun . Perhatikan bahwa perubahan variabel memerlukan dan (menganggap sebagai kepadatan distribusi) sehingga Hukum Total Probabilitas dapat dinyatakan sebagai- p ( e yyx = e y d x = e y d y pp(ey)=0x=eydx=eydyp

(1)1=0p(x)dx=Req(y)+ydy.

Mari kita asumsikan saat . eq(y)+y0y± p 0 p ( 1 ) Ini mengesampingkan distribusi probabilitas dengan banyak lonjakan kepadatan di dekat atau . Secara khusus, jika ekor pada akhirnya monoton, menyiratkan asumsi ini, menunjukkan itu bukan yang parah.p0p(1)

Untuk membuat bekerja dengan logaritma lebih mudah, amati juga

1+ϵ=eϵ+O(ϵ2).

Karena perhitungan berikut akan dilakukan hingga kelipatan dari , tentukanϵ2

δ=log(1+ϵ).

Kita juga dapat mengganti dengan , dengan sesuai dengan dan positif berhubungan dengan positif .1+ϵ δ = 0 ϵ = 0 δ ϵeδδ=0ϵ=0δϵ

Analisis

Salah satu cara yang jelas di mana ketimpangan dapat gagal adalah untuk integral untuk menyimpang untuk beberapa . Ini akan terjadi jika, misalnya, harus ada setiap interval yang tepat dari angka positif, tidak peduli seberapa kecil, di mana adalah identik nol tetapi tidak nol pada interval .Itu akan menyebabkan integand menjadi tak terbatas dengan probabilitas positif.ϵ(0,1]Ip(ϵ)ϵ(0,1]p p [ u - ϵ , v - ϵ ][u,v]pp[uϵ,vϵ]

Karena pertanyaannya tidak spesifik mengenai sifat , kita bisa terjebak dalam masalah teknis mengenai seberapa halus . Mari kita hindari masalah-masalah seperti itu, masih berharap untuk mendapatkan beberapa wawasan, dengan mengasumsikan bahwa mana-mana memiliki turunan sebanyak yang mungkin ingin kita gunakan. (Dua akan cukup jika kontinu.) Karena jaminan tetap terikat pada set terikat apa pun, itu menyiratkan bahwa tidak pernah nol ketika .p qppq q p ( x ) x > 0qqp(x)x>0

Perhatikan bahwa pertanyaan tersebut benar-benar menyangkut perilaku karena mendekati nol dari atas. Karena integral ini adalah fungsi kontinu dari dalam interval , ia mencapai beberapa maksimum ketika dibatasi untuk setiap interval positif , memungkinkan kita untuk memilih , karena jelasϵϵ(0,1] M p (a)ϵ[a,1]c= M pIp(ϵ)ϵϵ(0,1]Mp(a)ϵ[a,1] c ϵ 2 = M p ( a ) ( ϵc=Mp(a)/a2

cϵ2=Mp(a)(ϵa)2Mp(a)Ip(ϵ)

membuat ketidaksetaraan bekerja. Inilah mengapa kita hanya perlu memerhatikan modulo penghitungan .ϵ2

Larutan

Dengan menggunakan perubahan variabel dari ke , dari ke , dan ke , mari kita menghitung melalui urutan kedua dalam (atau ) dengan harapan dapat mencapai penyederhanaan. Untuk itu tentukany p qxypqϵδIp(ϵ)ϵδ

R(y,δ)δ2=q(y+δ)q(y)δq(y)

menjadi urutan- sisanya dalam ekspansi Taylor dari sekitar .2qy

Ip(ϵ)=Req(y)+y(q(y)q(y+δ)δ)dy=Req(y)+y(δ+δq(y)+R(y,δ)δ2)dy=δReq(y)+y(1+q(y))dyδ2Req(y)+yR(y,δ)dy.

Mengubah variabel ke di integral kiri menunjukkan itu harus menghilang, seperti yang dinyatakan dalam asumsi berikut . Mengubah variabel kembali ke di integral kanan memberiq(y)+y(1)x=ey

Ip(ϵ)=δ2Rp(x)R(log(x),δ)dy=δ2Ep(R(log(x),δ)).

Ketimpangan berlaku (di bawah berbagai asumsi teknis kami) jika dan hanya jika koefisien di sisi kanan terbatas.δ2

Penafsiran

Ini adalah titik yang baik untuk berhenti, karena tampaknya mengungkap masalah penting: dibatasi oleh fungsi kuadrat dari tepatnya ketika kesalahan kuadratik dalam ekspansi Taylor dari tidak meledak (relatif terhadap distribusi) sebagai pendekatan .Ip(ϵ)ϵqy±

Mari kita periksa beberapa kasus yang disebutkan dalam pertanyaan: distribusi Exponential dan Gamma. (Eksponensial adalah kasus khusus dari Gamma.) Kita tidak perlu khawatir tentang parameter skala, karena mereka hanya mengubah satuan pengukuran. Hanya parameter non-skala yang penting.

Di sini, karena untuk , Ekspansi Taylor di sekitar sembarang adalahTeorema Taylor dengan Remainder menyiratkan didominasi oleh untuk cukup kecil . Karena ekspektasi adalah terbatas, ketidaksetaraan berlaku untuk distribusi Gamma.p(x)=xkexk>1

q(y)=ey+kylogΓ(k+1).
yR(log(x),δ)e
Constant+(key)δey2δ2+.
R(log(x),δ)δxey+δ/2<xδx

Perhitungan serupa menyiratkan ketidaksetaraan untuk distribusi Weibull, distribusi Half-Normal, distribusi Lognormal, dll. Bahkan, untuk mendapatkan contoh tandingan kita perlu melanggar setidaknya satu asumsi, memaksa kita untuk melihat distribusi di mana menghilang pada beberapa interval, atau apakah tidak dua kali terus menerus dapat dibedakan, atau memiliki banyak mode yang tak terhingga. Ini adalah tes mudah untuk diterapkan pada keluarga distribusi mana pun yang biasa digunakan dalam pemodelan statistik.p

whuber
sumber