Saya mencoba mengambil sampel dari posterior yang memiliki banyak mode, terutama yang saling berjauhan menggunakan MCMC. Tampaknya dalam kebanyakan kasus, hanya satu dari mode ini yang mengandung 95% hp yang saya cari. Saya mencoba menerapkan solusi berdasarkan simulasi tempered tetapi ini tidak memberikan hasil yang memuaskan karena dalam praktiknya dari satu "jangkauan penangkapan" ke yang lain adalah mahal.
Sebagai akibatnya, tampak bagi saya bahwa solusi yang lebih efisien adalah menjalankan banyak MCMC sederhana dari titik awal yang berbeda dan untuk terjun ke solusi dominan dengan membuat MCMC saling berinteraksi. Apakah Anda tahu jika ada cara yang tepat untuk menerapkan gagasan seperti itu?
Catatan: Saya menemukan kertas itu http://lccc.eecs.berkeley.edu/Papers/dmcmc_short.pdf (rantai Markov yang didistribusikan Monte Carlo, Lawrence Murray) yang terlihat dekat dengan apa yang saya cari, tetapi saya benar-benar tidak mengerti desainnya. dari fungsi .
[EDIT]: kurangnya jawaban tampaknya menunjukkan bahwa tidak ada solusi yang jelas untuk masalah awal saya (membuat beberapa sampel MCMC dari distribusi target yang sama dari titik awal yang berbeda saling berinteraksi). Benarkah ? mengapa begitu rumit? Terima kasih
sumber
Jawaban:
Pertama-tama saya akan merekomendasikan untuk mencari metode yang lebih baik, atau setidaknya metode dengan deskripsi yang lebih mendalam, karena "Rantai Markov Terdistribusi Monte Carlo" dari makalah yang Anda maksudkan tampaknya tidak dinyatakan secara jelas. Keuntungan dan kerugiannya tidak dieksplorasi dengan baik. Ada metode, yang muncul di arxiv baru-baru ini disebut " Wormhole Hamiltonian Monte Carlo ", saya akan merekomendasikan untuk memeriksanya.
Kembali ke kertas yang Anda berikan referensi, proposal jarak jauh sangat samar-samar dijelaskan. Pada bagian aplikasi itu digambarkan sebagai "kemungkinan maksimum Gaussian atas sampel t / 2 sebelumnya". Mungkin ini berarti Anda rata-rata nilai t / 2 terakhir dari rantai ? Agak sulit ditebak dengan deskripsi buruk yang diberikan dalam referensi.i t hRi(θi) ith
[PEMBARUAN:] Interaksi antara beberapa rantai dan penerapan ide ini untuk sampel dari distribusi posterior dapat ditemukan dalam metode MCMC paralel, misalnya di sini . Namun, menjalankan beberapa rantai dan memaksa mereka untuk berinteraksi mungkin tidak cocok untuk posterior multimodal: misalnya, jika ada daerah yang sangat menonjol di mana sebagian besar distribusi posterior terkonsentrasi, interaksi rantai tersebut bahkan dapat memperburuk keadaan dengan tetap berpegang pada spesifik tersebut. wilayah dan tidak menjelajahi wilayah / mode lain yang kurang menonjol. Jadi, saya akan sangat menyarankan untuk mencari MCMC yang dirancang khusus untuk masalah multimodal. Dan jika Anda ingin membuat metode lain / baru, maka setelah Anda tahu apa yang tersedia di "pasar", Anda dapat membuat metode yang lebih efisien.
sumber
Anda harus mencoba multinest: https://arxiv.org/pdf/0809.3437.pdf https://github.com/JohannesBuchner/MultiNest Ini adalah mesin inferensi bayesian yang akan memberi Anda sampel parameter untuk distribusi multimoda.
Tautan github berisi kode sumber multinest yang Anda kompilasi dan instal sesuai instruksi. ini juga memiliki pembungkus python yang lebih mudah digunakan. Kode contoh memiliki bagian sebelumnya yang berfungsi untuk membatasi parameter Anda, dan bagian kemungkinan yang berisi kemungkinan Anda. file pengaturan berisi semua pengaturan Anda, dan rantai output folder multinest setelah pas. itu akan memberi Anda sampel parameter Anda
sumber
Ini tampaknya menjadi masalah yang sulit dan berkelanjutan dalam statistik komputasi. Namun, ada beberapa metode yang tidak terlalu canggih yang bisa digunakan.
Katakanlah Anda telah menemukan beberapa mode berbeda dari posterior dan Anda senang bahwa ini adalah mode yang paling penting, dan jika posterior di sekitar mode ini cukup normal. Kemudian Anda dapat menghitung hessian pada mode ini (katakanlah, menggunakan optim dalam R dengan hessian = T) dan Anda dapat memperkirakan posterior sebagai campuran normal (atau distribusi t). Lihat p318-319 dalam Gelman et al. (2003) "Analisis Data Bayesian" untuk perincian. Kemudian Anda dapat menggunakan aproksimasi normal / t-campuran sebagai distribusi proposal dalam sampler independen untuk mendapatkan sampel dari posterior penuh.
Gagasan lain, yang belum saya coba, adalah Annealed Importance Sampling (Radford Neal, 1998, tautan di sini ).
sumber
Bagaimana dengan mencoba metode MCMC baru untuk multimodality, algoritma Metropolis yang menarik dan menarik ( http://arxiv.org/abs/1601.05633 )? Sampler multimoda ini bekerja dengan parameter tuning tunggal seperti algoritma Metropolis dan mudah diterapkan.
sumber