Saya tertarik untuk memperkirakan kepadatan dari variabel acak kontinu . Salah satu cara melakukan ini yang saya pelajari adalah penggunaan Kernel Density Estimation.
Tapi sekarang saya tertarik pada pendekatan Bayesian yang mengikuti garis berikut. Saya awalnya percaya bahwa mengikuti distribusi . Aku mengambil pembacaan . Apakah ada beberapa pendekatan untuk memperbarui berdasarkan pada bacaan baru saya?
Saya tahu saya terdengar seperti saya menentang diri saya sendiri: Jika saya hanya percaya pada sebagai distribusi saya sebelumnya, maka tidak ada data yang bisa meyakinkan saya sebaliknya. Namun, anggaplah adalah dan titik data saya seperti . Melihat , saya jelas-jelas tidak dapat menempel pada sebelumnya, tetapi bagaimana saya harus memperbaruinya?
Pembaruan: Berdasarkan saran dalam komentar, saya sudah mulai melihat proses Dirichlet. Biarkan saya menggunakan notasi berikut:
Setelah membingkai masalah asli saya dalam bahasa ini, saya kira saya tertarik pada yang berikut: . Bagaimana caranya?
Dalam rangkaian catatan ini (halaman 2), penulis melakukan contoh (Skema Urn Urn Skema). Saya tidak yakin apakah ini relevan.
Pembaruan 2: Saya juga ingin bertanya (setelah melihat catatan): bagaimana orang memilih untuk DP? Sepertinya pilihan acak. Selain itu, bagaimana orang memilih H sebelumnya untuk DP? Haruskah saya menggunakan prior untuk θ sebagai prior saya untuk H ?
sumber
Jawaban:
Karena Anda menginginkan pendekatan bayesian, Anda perlu mengasumsikan pengetahuan sebelumnya tentang hal yang ingin Anda perkirakan. Ini akan dalam bentuk distribusi.
Sekarang, ada masalah bahwa ini sekarang distribusi melalui distribusi. Namun, ini tidak masalah jika Anda menganggap bahwa distribusi kandidat berasal dari beberapa kelas distribusi yang diparameterisasi.
Misalnya, jika Anda ingin menganggap data terdistribusi gaussian dengan mean yang tidak diketahui tetapi varian yang diketahui, maka semua yang Anda butuhkan adalah prior daripada mean.
Estimasi MAP dari parameter yang tidak diketahui (sebut saja ) dapat dilanjutkan dengan mengasumsikan bahwa semua titik pengamatan / data independen secara kondisional mengingat parameter yang tidak diketahui. Kemudian, perkiraan MAP adalahθ
,θ^=argmaxθ(Pr[x1,x2,...,xn,θ])
dimana
.Pr[x1,x2,...,xn,θ]=Pr[x1,x2,...,xn|θ]Pr[θ]=Pr[θ]∏ni=1Pr[xi|θ]
Perlu dicatat bahwa ada kombinasi tertentu dari probabilitas sebelumnya dan distribusi kandidat Pr [ x | θ ] yang memunculkan pembaruan yang mudah (bentuk tertutup) karena lebih banyak poin data diterima.Pr[θ] Pr[x|θ]
sumber
Untuk keperluan estimasi kepadatan, yang Anda butuhkan bukan
.θn+1|x1,…,xn
Rumus dalam catatan mengacu pada distribusi prediktif dari proses Dirichlet.θn+1|θ1,…,θn
Untuk estimasi kepadatan Anda sebenarnya harus mengambil sampel dari distribusi prediktif
Pengambilan sampel dari distribusi di atas dapat dilakukan baik dengan metode kondisional baik dengan metode marginal. Untuk metode bersyarat, lihat kertas Stephen Walker [1]. Untuk metode marginal, Anda harus memeriksa di makalah Radford Neal [2].
Untuk parameter concnetration Mike West [3] mengusulkan metode untuk inferensi dalam prosedur MCMC termasuk distribusi bersyarat penuh untuk α . Jika Anda memutuskan untuk tidak memperbarui konsentrasi α dalam prosedur MCMC, Anda harus ingat bahwa jika Anda memilih nilai besar untuknya, maka jumlah nilai berbeda yang diambil dari proses Dirichlet akan lebih besar daripada jumlah nilai berbeda saat sejumlah kecil untuk α akan digunakan.α α α α
[1] SG, Walker (2006). Mencicipi model Campuran Dirichlet dengan irisan. Komunikasi dalam Statistik (Simulasi dan Perhitungan).
[2] RM, Neal (2000) Metode Markov Chain Monte Carlo untuk model Dirichlet Process Mixture. Jurnal Statistik Komputasi dan Grafik. Vol 9, No 2, hlm 249-265
[3] M., Barat (1992). Estimasi Hyperparameter dalam model campuran proses Dirichlet. Laporan teknikal
sumber
Ada sesuatu tepatnya untuk itu. Ini adalah ide utama kesimpulan Bayesian.
sumber