Untuk pemahaman saya Perkiraan Bayesian Computation (ABC) dan Markov Chain Monte Carlo (MCMC) memiliki tujuan yang sangat mirip. Di bawah ini saya menjelaskan pemahaman saya tentang metode ini dan bagaimana saya melihat perbedaan dalam penerapannya pada data kehidupan nyata.
Perkiraan Bayesian Computation
ABC terdiri atas pengambilan sampel parameter dari sebelumnya, melalui simulasi numerik menghitung statistik yang dibandingkan dengan beberapa diamati . Berdasarkan algoritma penolakan, dipertahankan atau ditolak. Daftar dipertahankan membuat distribusi posterior.x o b s x i x i
Markov Chain Monte Carlo
MCMC terdiri atas pengambilan sampel distribusi sebelum parameter . Dibutuhkan sampel pertama , hitung dan kemudian lompat (sesuai beberapa aturan) ke nilai baru yang dihitung lagi. Rasio dihitung dan tergantung pada beberapa nilai ambang, lompatan berikutnya akan terjadi dari posisi pertama atau kedua. Eksplorasi nilai-nilai berjalan satu dan satu dan pada akhirnya, distribusi nilai-nilai dipertahankan adalah distribusi posteriorθ 1 P ( x o b s | θ 1 ) P ( θ 1 ) θ 2 P ( x o b s | θ 2 ) P ( θ 2 ) P ( x o b s | θ 2 ) P ( θ 2 ) (untuk suatu alasan yang masih belum saya ketahui).
Saya menyadari bahwa penjelasan saya ketinggalan untuk mewakili berbagai metode yang ada di bawah masing-masing istilah ini (terutama untuk MCMC).
ABC vs MCMC (pro dan kontra)
ABC memiliki keuntungan bahwa seseorang tidak perlu dapat secara analitis menyelesaikan . Karena itu, ABC cocok untuk model rumit di mana MCMC tidak akan membuatnya.
MCMC memungkinkan untuk melakukan tes statistik (uji rasio kemungkinan, G-test, ...) sementara saya tidak berpikir ini layak dengan ABC.
Apakah saya benar sejauh ini?
Pertanyaan
- Apa perbedaan antara ABC dan MCMC dalam aplikasi mereka? Bagaimana seseorang memutuskan untuk menggunakan satu atau metode lain?
Jawaban:
Beberapa komentar tambahan di atas jawaban Björn:
ABC pertama kali diperkenalkan oleh Rubin (1984) sebagai penjelasan tentang sifat inferensi Bayesian, daripada untuk tujuan komputasi. Dalam makalah ini ia menjelaskan bagaimana distribusi sampling dan distribusi sebelumnya berinteraksi untuk menghasilkan distribusi posterior.
Namun ABC terutama dieksploitasi untuk alasan komputasi. Para ahli genetika populasi menemukan metode pada model berbasis pohon di mana kemungkinan sampel yang diamati tidak dapat dipecahkan. Skema MCMC (Augmentasi Data) yang tersedia dalam pengaturan seperti itu sangat tidak efisien dan begitu juga sampling penting, bahkan dengan parameter dimensi tunggal ... Pada intinya, ABC adalah pengganti metode Monte Carlo seperti MCMC atau PMC ketika itu tidak tersedia untuk semua tujuan praktis. Ketika tersedia, ABC muncul sebagai proksi yang dapat digunakan untuk mengkalibrasi mereka jika berjalan lebih cepat.
Dalam perspektif yang lebih modern, saya pribadi menganggap ABC sebagai metode inferensi perkiraan daripada teknik komputasi. Dengan membangun model perkiraan, seseorang dapat menarik kesimpulan pada parameter yang diinginkan tanpa harus bergantung pada model yang tepat. Sementara beberapa tingkat validasi diperlukan dalam pengaturan ini, itu tidak kurang valid daripada melakukan rata-rata model atau non-parametrik. Faktanya, ABC dapat dilihat sebagai tipe khusus dari statistik Bayesian non-parametrik.
Dapat juga ditunjukkan bahwa (berisik) ABC adalah pendekatan Bayesian yang terdefinisi dengan sempurna jika seseorang mengganti model dan data asli dengan yang berisik. Karena itu memungkinkan untuk semua kesimpulan Bayes yang bisa dipikirkan orang. Termasuk pengujian. Masukan kami untuk perdebatan tentang ABC dan pengujian hipotesis adalah bahwa model perkiraan yang mendasari ABC mungkin berakhir sebagai buruk dilengkapi untuk menilai relevansi dari suatu hipotesis yang diberikan data, tetapi tidak tentu , yang hanya juga karena sebagian besar aplikasi dari ABC dalam populasi genetika berkaitan dengan pilihan model.
Dalam perspektif yang bahkan lebih baru, kita dapat melihat ABC sebagai versi Bayesian dari inferensi tidak langsung di mana parameter model statistik terkait dengan momen-momen statistik yang telah ditentukan sebelumnya. Jika statistik ini cukup (atau cukup dalam arti vernakular) untuk mengidentifikasi parameter-parameter ini, ABC dapat ditunjukkan untuk menyatu dengan nilai sebenarnya dari parameter dengan jumlah pengamatan.
sumber
Sebenarnya ada versi MCMC dari ABC, yang membahas masalah bahwa jika Anda memiliki prior yang tidak mirip dengan posterior (misalnya karena prior sangat tidak informatif) pengambilan sampel dengan menggambar dari prior sangat tidak efisien, karena Anda sangat jarang akan mendapatkan kecocokan dekat antara data yang diamati dan yang disimulasikan.
sumber