Apakah ada pendekatan Bayesian untuk estimasi kepadatan

22

Saya tertarik untuk memperkirakan kepadatan dari variabel acak kontinu X . Salah satu cara melakukan ini yang saya pelajari adalah penggunaan Kernel Density Estimation.

Tapi sekarang saya tertarik pada pendekatan Bayesian yang mengikuti garis berikut. Saya awalnya percaya bahwa X mengikuti distribusi F . Aku mengambil n pembacaan . Apakah ada beberapa pendekatan untuk memperbarui berdasarkan pada bacaan baru saya?XF

Saya tahu saya terdengar seperti saya menentang diri saya sendiri: Jika saya hanya percaya pada sebagai distribusi saya sebelumnya, maka tidak ada data yang bisa meyakinkan saya sebaliknya. Namun, anggaplah adalah dan titik data saya seperti . Melihat , saya jelas-jelas tidak dapat menempel pada sebelumnya, tetapi bagaimana saya harus memperbaruinya?FFUnif[0,1](0.3,0.5,0.9,1.7)1.7

Pembaruan: Berdasarkan saran dalam komentar, saya sudah mulai melihat proses Dirichlet. Biarkan saya menggunakan notasi berikut:

GDP(α,H)θi|GGxi|θiN(θi,σ2)

Setelah membingkai masalah asli saya dalam bahasa ini, saya kira saya tertarik pada yang berikut: . Bagaimana caranya?θn+1|x1,...,xn

Dalam rangkaian catatan ini (halaman 2), penulis melakukan contoh (Skema Urn Urn Skema). Saya tidak yakin apakah ini relevan.θn+1|θ1,...,θn

Pembaruan 2: Saya juga ingin bertanya (setelah melihat catatan): bagaimana orang memilih untuk DP? Sepertinya pilihan acak. Selain itu, bagaimana orang memilih H sebelumnya untuk DP? Haruskah saya menggunakan prior untuk θ sebagai prior saya untuk H ?αHθH

renrenthehamster
sumber
2
"Jika saya hanya percaya pada F sebagai distribusi saya sebelumnya, maka tidak ada data yang bisa meyakinkan saya sebaliknya." Ini adalah kebalikan dari kesimpulan Bayesian, yang lebih sesuai dengan apa yang Anda yakini di satu sisi dan dunia di sisi lain, dan bubuhkan bersama-sama dan lihat apa yang keluar. Cuci, bilas, ulangi.
Alexis
Apakah Anda tahu sesuatu tentang proses balon?
niandra82
Mengabaikan paragraf terakhir Anda: ada dua opsi umum untuk masalah ini. Salah satunya adalah campuran normal normals (Anda dapat memilih berapa banyak normals berdasarkan kemungkinan validasi silang) atau campuran normals tak terhingga seperti yang disarankan oleh niandra82. Ini dapat dilakukan dengan sesuatu seperti sampling Gibbs atau inferensi variasional .. Apakah Anda terbiasa dengan metode ini?
Saya juga harus bertanya, bagaimana Anda ingin menggunakan KDE ini? Metode yang dipilih dan ukurannya (tak terbatas, terbatas) mungkin tergantung pada tujuan Anda.
Ini terdengar seperti masalah pilihan model atau masalah filosofis. Pada kenyataannya, pilihan kita yang kemungkinan untuk digunakan dalam inferensi Bayesian memaksakan kepercayaan sebelumnya juga ...
Zoë Clark

Jawaban:

2

Karena Anda menginginkan pendekatan bayesian, Anda perlu mengasumsikan pengetahuan sebelumnya tentang hal yang ingin Anda perkirakan. Ini akan dalam bentuk distribusi.

Sekarang, ada masalah bahwa ini sekarang distribusi melalui distribusi. Namun, ini tidak masalah jika Anda menganggap bahwa distribusi kandidat berasal dari beberapa kelas distribusi yang diparameterisasi.

Misalnya, jika Anda ingin menganggap data terdistribusi gaussian dengan mean yang tidak diketahui tetapi varian yang diketahui, maka semua yang Anda butuhkan adalah prior daripada mean.

Estimasi MAP dari parameter yang tidak diketahui (sebut saja ) dapat dilanjutkan dengan mengasumsikan bahwa semua titik pengamatan / data independen secara kondisional mengingat parameter yang tidak diketahui. Kemudian, perkiraan MAP adalahθ

,θ^=argmaxθ(Pr[x1,x2,...,xn,θ])

dimana

.Pr[x1,x2,...,xn,θ]=Pr[x1,x2,...,xn|θ]Pr[θ]=Pr[θ]i=1nPr[xi|θ]

Perlu dicatat bahwa ada kombinasi tertentu dari probabilitas sebelumnya dan distribusi kandidat Pr [ x | θ ] yang memunculkan pembaruan yang mudah (bentuk tertutup) karena lebih banyak poin data diterima.Pr[θ]Pr[x|θ]

kacang
sumber
1

Untuk keperluan estimasi kepadatan, yang Anda butuhkan bukan

.θn+1|x1,,xn

Rumus dalam catatan mengacu pada distribusi prediktif dari proses Dirichlet.θn+1|θ1,,θn

Untuk estimasi kepadatan Anda sebenarnya harus mengambil sampel dari distribusi prediktif

π(dxn+1|x1,,xn)

Pengambilan sampel dari distribusi di atas dapat dilakukan baik dengan metode kondisional baik dengan metode marginal. Untuk metode bersyarat, lihat kertas Stephen Walker [1]. Untuk metode marginal, Anda harus memeriksa di makalah Radford Neal [2].

Untuk parameter concnetration Mike West [3] mengusulkan metode untuk inferensi dalam prosedur MCMC termasuk distribusi bersyarat penuh untuk α . Jika Anda memutuskan untuk tidak memperbarui konsentrasi α dalam prosedur MCMC, Anda harus ingat bahwa jika Anda memilih nilai besar untuknya, maka jumlah nilai berbeda yang diambil dari proses Dirichlet akan lebih besar daripada jumlah nilai berbeda saat sejumlah kecil untuk α akan digunakan.αααα

[1] SG, Walker (2006). Mencicipi model Campuran Dirichlet dengan irisan. Komunikasi dalam Statistik (Simulasi dan Perhitungan).

[2] RM, Neal (2000) Metode Markov Chain Monte Carlo untuk model Dirichlet Process Mixture. Jurnal Statistik Komputasi dan Grafik. Vol 9, No 2, hlm 249-265

[3] M., Barat (1992). Estimasi Hyperparameter dalam model campuran proses Dirichlet. Laporan teknikal

Christos
sumber
-1

Apakah ada beberapa pendekatan untuk memperbarui F berdasarkan pada bacaan baru saya?

Ada sesuatu tepatnya untuk itu. Ini adalah ide utama kesimpulan Bayesian.

p(θ|y)p(y|θ)p(θ)

p(θ)Fp(y|θ)θ

p(θ)

rcorty
sumber
3
FX1,,XniidFFL(F)=i=1NdFdx|x=xiF