MCMC dengan algoritma Metropolis-Hastings: Memilih proposal

13

Saya perlu melakukan simulasi untuk mengevaluasi integral dari fungsi 3 parameter, kita katakan , yang memiliki rumus yang sangat rumit. Diminta untuk menggunakan metode MCMC untuk menghitungnya dan mengimplementasikan algoritma Metropolis-Hastings untuk menghasilkan nilai yang didistribusikan sebagai f , dan disarankan untuk menggunakan 3 variasi normal sebagai distribusi proposal. Membaca beberapa contoh tentang hal itu, saya telah melihat bahwa beberapa dari mereka kemudian menggunakan normal dengan parameter tetap N ( μ , σ ) dan beberapa menggunakan dengan rata-rata variabel N ( X , σ ) , di mana X adalah nilai yang diterima terakhir sebagaimana didistribusikan menurut fffN(μ,σ)N(X,σ)Xf. Saya ragu tentang kedua pendekatan ini:

1) Apa arti dari memilih nilai yang terakhir diterima sebagai rata-rata baru dari distribusi proposal kami? Intuisi saya mengatakan itu harus menjamin bahwa nilai-nilai kita akan lebih dekat dengan nilai-nilai yang didistribusikan karena dan peluang penerimaan akan lebih besar. Tapi bukankah itu terlalu banyak mengkonsentrasikan sampel kita? Dijamin bahwa, jika saya mendapatkan lebih banyak sampel, rantai akan menjadi stasioner?f

2) Tidak akan memilih parameter tetap (karena sangat sulit untuk dianalisis) menjadi sangat sulit dan tergantung pada sampel pertama yang perlu kita pilih untuk memulai algoritme? Dalam hal ini, apa pendekatan terbaik untuk menemukan mana yang lebih baik?f

Apakah salah satu dari pendekatan itu lebih baik daripada yang lain atau ini tergantung pada kasusnya?

Saya harap keraguan saya jelas dan saya akan senang jika beberapa literatur dapat diberikan (saya sudah membaca beberapa makalah tentang tema, tetapi lebih banyak lebih baik!)

Terima kasih sebelumnya!

Giiovanna
sumber

Jawaban:

10

1) Anda bisa memikirkan metode ini sebagai pendekatan berjalan acak. Ketika distribusi proposal , itu biasanya disebut sebagai Algoritma Metropolis. Jika σ 2 terlalu kecil, Anda akan memiliki tingkat penerimaan yang tinggi dan sangat lambat mengeksplorasi target distribusi. Bahkan, jika σ 2 terlalu kecil dan distribusinya multi-modal, sampler mungkin akan terjebak dalam mode tertentu dan tidak akan dapat sepenuhnya mengeksplorasi target distribusi. Di sisi lain, jika σ 2xxtN(xt,σ2)σ2σ2σ2terlalu besar, tingkat penerimaan akan terlalu rendah. Karena Anda memiliki tiga dimensi, distribusi proposal Anda akan memiliki matriks kovarian yang kemungkinan akan memerlukan varian dan kovarian yang berbeda untuk setiap dimensi. Memilih yang tepat Σ mungkin sulit.ΣΣ

2) Jika distribusi proposal Anda selalu , maka ini adalah algoritma Metropolis-Hastings yang independen karena distribusi proposal Anda tidak bergantung pada sampel Anda saat ini. Metode ini bekerja paling baik jika distribusi proposal Anda merupakan perkiraan yang baik dari distribusi target yang ingin Anda sampel. Anda benar bahwa memilih perkiraan normal yang baik bisa sulit.N(μ,σ2)

Keberhasilan metode tidak harus tergantung pada nilai awal sampler. Di mana pun Anda memulai, rantai Markov pada akhirnya harus menyatu dengan distribusi target. Untuk memeriksa konvergensi, Anda dapat menjalankan beberapa rantai dari titik awal yang berbeda dan melakukan diagnostik konvergensi seperti diagnostik konvergensi Gelman-Rubin.

jsk
sumber
N(μ,σ2)N(μ,σ2)
@rhody. Algoritma Metropolis tidak menjatuhkan pengkondisian pada lokasi Anda saat ini. Intinya adalah perlahan-lahan berkeliaran di sekitar ruang parameter dengan proposal simetris dari lokasi Anda saat ini. Menggunakan proposal simetris APAPUN yang bergantung pada lokasi Anda saat ini dan perhitungan probabilitas penerimaan Metropolis, Anda pada akhirnya akan menyatu dengan distribusi target. Untuk algoritma Metropolis-Hastings yang independen, Anda ingin distribusi proposal Anda menjadi perkiraan dari distribusi target, dan Anda menggunakan perhitungan yang berbeda untuk probabilitas penerimaan.
jsk
qN(μ,σ2)q(Y)q(X)XY
xN(x,ε)