Pemahaman saya adalah bahwa ketika menggunakan pendekatan Bayesian untuk memperkirakan nilai parameter:
- Distribusi posterior adalah kombinasi dari distribusi sebelumnya dan distribusi kemungkinan.
- Kami mensimulasikan ini dengan menghasilkan sampel dari distribusi posterior (misalnya, menggunakan algoritma Metropolis-Hasting untuk menghasilkan nilai, dan menerimanya jika mereka berada di atas ambang batas probabilitas tertentu untuk menjadi milik distribusi posterior).
- Setelah kami membuat sampel ini, kami menggunakannya untuk memperkirakan distribusi posterior, dan hal-hal seperti artinya.
Tapi, saya merasa saya harus salah paham akan sesuatu. Kedengarannya seperti kita memiliki distribusi posterior dan kemudian sampel darinya, dan kemudian menggunakan sampel itu sebagai perkiraan distribusi posterior. Tetapi jika kita memiliki distribusi posterior untuk memulai dengan mengapa kita perlu mengambil sampel darinya untuk memperkirakannya?
Ya, Anda mungkin memiliki distribusi posterior analitik. Tetapi inti dari analisis Bayesian adalah memarginalkan distribusi parameter posterior sehingga Anda mendapatkan hasil prediksi yang lebih baik dalam hal akurasi dan kemampuan generalisasi. Pada dasarnya, Anda ingin mendapatkan distribusi prediksi yang memiliki bentuk berikut.
sumber