Terikat pada dalam hal selain ketidaksetaraan Jensen?

21

Jika adalah fungsi cembung maka ketidaksetaraan Jensen menyatakan bahwa , dan saling mutatis ketika adalah cekung. Jelas dalam kasus terburuk Anda tidak bisa menggunakan batas atas dalam hal untuk cembung , tetapi apakah ada batas yang mengarah ke arah ini jika adalah cembung tetapi "tidak terlalu cembung"? Apakah ada beberapa batasan standar yang memberikan kondisi pada fungsi cembung (dan mungkin distribusi juga, jika perlu) yang akan memungkinkan Anda untuk menyimpulkan bahwa , di manaff E [ f ( x ) ] f ( E [ x ] ) f f f E [ f ( x ) ] φ ( f ) f ( E [ x ] ) φ ( f ) ff(E[x])E[f(x)]fE[f(x)]f(E[x])fffE[f(x)]φ(f)f(E[x])φ(f)Apakah beberapa fungsi dari kelengkungan / tingkat konveksitas ? Sesuatu yang mirip dengan kondisi Lipschitz, mungkin?f

Ian
sumber
Voting untuk ditutup sebagai di luar topik. math.stackexchange.com mungkin?
Aryabhata
7
Saya pikir pertanyaan ini harus tetap terbuka; ini adalah semacam ketidaksetaraan yang menurut banyak ahli teori kerja bermanfaat secara berkala.
Aaron Roth
10
Saya tahu bahwa ini lebih dekat dengan matematika murni daripada sebagian besar pertanyaan yang diposting sejauh ini, tapi saya berpendapat bahwa ini adalah topik karena hal semacam ini sering muncul dalam analisis algoritma acak (yang merupakan aplikasi yang saya miliki di pikiran). Saya pikir matematika yang banyak digunakan dalam ilmu komputer harus dianggap permainan yang adil untuk pertanyaan.
Ian
6
pilih untuk tetap terbuka. pasti pada topik
Suresh Venkat
1
Saya juga memilih untuk tetap terbuka.
Jeffε

Jawaban:

21

EDIT: versi asli melewatkan nilai absolut. Maaf!!

Hai Ian. Saya akan secara singkat menguraikan dua ketidaksetaraan sampel, satu menggunakan ikatan Lipschitz, yang lain menggunakan ikatan pada turunan kedua, dan kemudian membahas beberapa kesulitan dalam masalah ini. Meskipun saya berlebihan, karena pendekatan yang menggunakan satu turunan menjelaskan apa yang terjadi dengan lebih banyak turunan (melalui Taylor), ternyata versi turunan kedua cukup bagus.

Pertama, dengan ikatan Lipschitz: cukup kerjakan kembali ketimpangan Jensen standar. Trik yang sama berlaku: hitung ekspansi Taylor pada nilai yang diharapkan.

Secara khusus, Misalkan memiliki ukuran yang sesuai , dan atur . Jika memiliki konstanta Lipschitz , maka dengan teorema Taylorμ m : = E ( x ) f LXμm:=E(x)fL

f(x)=f(m)+f(z)(xm)f(m)+L|xm|,

di mana (perhatikan bahwa dan adalah mungkin). Menggunakan ini dan bekerja kembali bukti Jensen (saya paranoid dan memeriksa bahwa yang standar memang ada di wikipedia),x m x > mz[m,x]xmx>m

E(f(X))=f(x)dμ(x)f(m)dμ(x)+L|xm|dμ(x)=f(E(X))+LE(|XE(X)|).

Sekarang, misalkan . Pada kasus ini,|f(x)|λ

f(x)=f(m)+f(m)(xm)+f(z)(xm)22f(m)+f(m)(xm)+λ(xm)22,

dan sebagainya

E(f(X))f(m)+f(m)(E(X)m)+λE((Xm)2)2=f(E(X))+λVar(X)2.

Saya ingin menyebutkan secara singkat beberapa hal. Maaf jika sudah jelas.

Pertama, Anda tidak bisa hanya mengatakan "wlog " dengan menggeser distribusi, karena Anda mengubah hubungan antara dan .f μE(X)=0fμ

Berikutnya adalah bahwa terikat harus bergantung pada distribusi dalam beberapa cara. Untuk melihat ini, bayangkan dan . Apa pun nilai , Anda masih mendapatkan . Di sisi lain, . Dengan demikian, dengan mengubah , Anda dapat membuat jarak antara dua kuantitas secara sewenang-wenang! Secara intuitif, lebih banyak massa didorong menjauh dari rata-rata, dan dengan demikian, untuk fungsi cembung apa pun, akan meningkat.f ( x ) = x 2 σ f ( E ( X ) ) = f ( 0 ) = 0XGaussian(0,σ2)f(x)=x2σf(E(X))=f(0)=0 σ E ( f ( X ) )E(f(X))=E(X2)=σ2σE(f(X))

Terakhir, saya tidak melihat cara mendapatkan ikatan multiplikasi seperti yang Anda sarankan. Semua yang saya gunakan dalam posting ini adalah standar: Teorema dan batas turunan Taylor adalah roti & mentega dalam batas statistik, dan mereka secara otomatis memberikan aditif, bukan kesalahan multiplikasi.

Saya akan memikirkannya, dan memposting sesuatu. Intuisi yang kabur adalah akan membutuhkan kondisi yang sangat berat pada fungsi dan distribusi, dan bahwa batas aditif sebenarnya di jantungnya.

matus
sumber
Setiap kali saya mengedit, jawabannya akan terbentur. Jadi saya akan tunjukkan: ikatan turunan kedua ketat untuk contoh yang saya berikan.
matus
Saya pikir Anda benar dalam batas aditif yang terbaik tanpa kondisi yang lebih kuat pada fungsi.
Ian
Dear Ian, saya memikirkan masalah ini sedikit lebih banyak, tetapi kesulitan utama dalam pikiran saya oleh contoh yang saya berikan, di mana , tetapi . Anda dapat membatasi keluarga fungsi (terikat, turunan terbatas, integrable) dan distribusi (lancar, terbatas, momemts terbatas), dan Anda masih memiliki contoh-contoh ini. Cukuplah untuk memiliki fungsi simetris, nonnegatif sama dengan nol pada rata-rata distribusi. Yang mengatakan, semuanya tergantung pada kendala dalam masalah Anda. Dalam kasus umum, saya pikir sifat aditif itu fundamental. E ( f ( X ) ) > 0f(E(X))=0E(f(X))>0
matus
@Ian: Bukti ketidaksetaraan Chernoff dan Azuma-Hoeffding menggunakan argumen yang mengingatkan ini, jadi Anda mungkin ingin membaca itu untuk inspirasi. Lihat misalnya buku Mitzenmacher dan Upfal tentang pengacakan dalam komputasi.
Warren Schudy
3

Untuk wawasan, pertimbangkan distribusi yang terkonsentrasi pada dua nilai; katakanlah, dengan probabilitas yang sama dengan 1/2 bahwa itu sama dengan 1 atau 3, di mana . Ambil dan . Pertimbangkan fungsi yang dan . Dengan membuat cukup kecil dan menghubungkan terus menerus di antara ketiga titik ini, kita dapat membuat lengkungan sekecil yang diinginkan. KemudianE[x]=2N>>0ϵ>0ff(1)=f(3)=Nϵf(E[x])=f(2)=ϵϵff

E[f(x)]=Nϵ , belum

N=Nϵ/ϵ=E[f(x)]/f(E[x])φ(f) .

Ini menunjukkan harus besar secara sewenang-wenang.φ(f)

whuber
sumber