Bagaimana cara membuktikan ketimpangan Gaussian Mixture ini? (Pas / Overfitting)

8

Biarkan f [x] menjadi Gaussian Mixture pdf dengan n syarat bobot seragam, berarti , dan varians yang sesuai :{μ1,...,μn}{σ1,...,σn}

f(x)1nsaya=1n12πσsaya2e-(x-μsaya)22σsaya2

Tampaknya intuitif bahwa kemungkinan log yang diambil sampel di pusat Gaussian akan lebih besar daripada (atau sama dengan) kemungkinan log rata-rata:

1nj=1nln(f(μj))f(x)ln(f(x))dx

Ini jelas benar untuk varian kecil (masing-masing berada di atas Gaussian sempit) dan untuk varian yang sangat besar (semua di atas satu Gaussian luas bersama-sama), dan memang benar untuk setiap set dan telah saya buat dan optimalkan, tetapi saya tidak dapat menemukan cara untuk membuktikan bahwa itu selalu benar. Tolong?μsayaμsayaμsayaσsaya

Jerry Guern
sumber
Anda mungkin melewatkan harapan pada lhs?
lacerbi
@ lacerbi Tidak, saya tidak. Tidak ada yang hilang. Di LHS, yang dievaluasi pada diindeks 'sf(x)xsaya
Jerry Guern
Ya, maaf - saya terlalu mengantuk dan saya salah membaca definisi.
lacerbi

Jawaban:

2

Ini lebih merupakan komentar yang diperluas, jadi anggaplah demikian. Definisikan: (saya menggunakan standar notasi untuk distribusi Gaussian).

f(x)1nsaya=1nN(x|xsaya,σsaya2)

Anda ingin membuktikan bahwa: yang

1nsaya=1ncatatanf(xsaya)-f(x)catatanf(x)dx0
{1nsaya=1ncatatanf(xsaya)}+H[f]0.

Karena ketidaksetaraan Jensen (lihat misalnya Huber et al., Tentang Entropy Approximation for Gaussian Mixture Random Vektor, 2008 ), dengan , yang berasal dari konvolusi dua kepadatan Gaussian. Jadi kita dapatkan: Menariknya, masih merupakan campuran dari Gaussians dengan rata-rata komponen sama dengan yang ada di

H[f]-1nsaya=1ncatatanf(x)N(x|xsaya,σsaya2)dx=-1nsaya=1ncatatangsaya(xsaya)
gsaya(x)1nj=1nN(x|xj,σsaya2+σj2)
{1nsaya=1ncatatanf(xsaya)}+H[f]1nsaya=1ncatatanf(xsaya)gsaya(xsaya).
gsayaf, tetapi masing-masing komponen memiliki varians yang benar-benar lebih besar daripada komponen terkait di . Bisakah Anda melakukan sesuatu dengan ini?gsayaf
Lacerbi
sumber
Terima kasih. Sepertinya saya baru saja membuktikan bahwa RHS akhir adalah> = 0, yang juga terlihat intuitif tetapi sulit untuk dibuktikan, tetapi ini memang merupakan langkah ke arah yang benar. Saya pernah melihat kertas itu sebelumnya.
Jerry Guern
Sangat menggoda untuk berpikir bahwa RHS akhir selalu positif, tetapi saya juga tidak dapat membuktikannya.
Jerry Guern
0

Saya rasa saya mengerti. Hanya diperlukan langkah-langkah dasar, meskipun Anda harus menggabungkannya dengan benar.

Mari kita dengan kepadatan -th Gaussian, yaitufsayasaya12πσsaya2e(x-μsaya)22σsaya2

Kami mulai dengan Ketimpangan Jensen. Fungsi adalah cembung, maka kita memiliki: . Setelah mengintegrasikan kita mendapatkan: Edit : Ketidaksamaan di bawah ini salah dan begitu juga solusinyag(x)=xlHaig(x)f(x)catatan(f(x))1nsaya=1nfsaya(x)catatan(fsaya(x))

f(x)catatan(f(x))dx1nsaya=1nfsaya(x)catatan(fsaya(x))dx

Sekarang RHS. Untuk semua kita memiliki , jadi: Oleh karena itu: Kita dibiarkan membuktikan: Tetapi kami memiliki: Menjumlahkan dan membaginya dengan kita mendapatkan apa kami membutuhkansayaffsaya

lHaig(f(μsaya))lHaig(fsaya(μsaya))
1nsaya=1nlHaig(f(μsaya))1nsaya=1nlHaig(fsaya(μsaya))
1nsaya=1nlHaig(fsaya(μsaya))1nsaya=1nfsaya(x)catatan(fsaya(x))
lHaig(fsaya(μsaya))=fsaya(x)lHaig(fsaya(μsaya))dxfsaya(x)lHaig(fsaya(x))dx
sayan
sjm.majewski
sumber
Saya bingung. Anda mendefinisikan ag (x) tetapi tidak pernah menggunakannya, dan saya tidak tahu apa arti f_i Anda.
Jerry Guern
Saya menambahkan definisi , maaf soal itu. Saya menggunakan hanya untuk ketidaksamaan Jensen, yaitufsayagg(1nsaya=1nfsaya(x))1nsaya=1ng(fsaya(x))
sjm.majewski
Pernyataan Anda bahwa hanya benar jika bobot adalah bagian dari definisi tetapi tidak, dan menambahkannya kembali ke bagian awal bukti Anda. f> =fsaya1/nfsaya
Jerry Guern
1
Pernyataan ini tidak benar:1nsaya=1nlHaig(f(μsaya))1nsaya=1nlHaig(fsaya(μsaya))
Jerry Guern
1
Ya, saya menyadarinya kemarin. Sepertinya ketidaksetaraan ini cukup sulit, saya akan tetap menjawab dengan mengedit.
sjm.majewski