Ada banyak literatur di luar sana tentang diagnostik konvergensi Markov chain Monte Carlo (MCMC), termasuk diagnostik Gelman-Rubin yang paling populer. Namun, semua ini menilai konvergensi rantai Markov, dan dengan demikian menjawab pertanyaan burn-in.
Setelah saya mengetahui burn-in, bagaimana saya harus memutuskan berapa banyak sampel MCMC yang cukup untuk melanjutkan proses estimasi saya? Sebagian besar makalah yang menggunakan MCMC menyebutkan bahwa mereka menjalankan rantai Markov untuk beberapaiterasi, tetapi jangan katakan apa-apa tentang mengapa / bagaimana mereka memilih nomor itu, .
Selain itu, satu ukuran sampel yang diinginkan tidak bisa menjadi jawaban untuk semua sampler, karena korelasi dalam rantai Markov sangat bervariasi dari masalah ke masalah. Jadi apakah ada aturan di luar sana untuk mengetahui jumlah sampel yang dibutuhkan?
sumber
John Kruschke dalam Doing Bayesian Data Analysis merekomendasikan bahwa untuk parameter yang menarik, rantai MCMC harus dijalankan sampai ukuran sampel efektifnya setidaknya 10.000. Meskipun tidak ada simulasi yang disajikan, saya percaya alasannya adalah bahwa ESS> 10.000 memastikan estimasi stabil secara numerik. Namun, saya telah melihat bahwa Andrew Gelman dan pengembang Stan lainnya merekomendasikan kurang (misalnya 2000 - 3000 baik-baik saja; sayangnya, tidak ada tautan yang pasti, tetapi melihat diskusi tentang kelompok pengguna Stan Google). Selain itu, untuk model yang rumit, rantai yang berjalan cukup lama untuk ESS> 10.000 bisa sangat sulit!
sumber
Ini memang salah satu kelemahan besar dari simulasi MCMC, karena tidak ada perkiraan umum dan apriori pada jumlah sampel. Saya pikir literatur yang baik di sini adalah "Beberapa hal yang telah kami pelajari (tentang MCMC)" oleh Persi Diaconis yang berkaitan dengan banyak seluk-beluk simulasi MCMC yang mungkin menunjukkan bahwa tidak ada jawaban yang mudah untuk pertanyaan ini.
Secara umum, membuat perkiraan yang baik tentang berapa lama untuk menjalankan rantai membutuhkan pemahaman yang baik tentang waktu pencampuran rantai Markov, yang sangat tergantung pada sifat-sifat grafik yang mendasarinya. Ada banyak metode "bebas terbakar" di luar sana untuk mengikat waktu pencampuran dari atas, tetapi semua metode ini memiliki kesamaan bahwa mereka memerlukan pemahaman yang lebih dalam tentang rantai Markov yang mendasarinya dan konstanta yang terlibat biasanya sulit untuk dihitung . Lihat misalnya "Konduktansi dan Pencampuran Cepat Rantai Markov" oleh King, "Path Coupling: Teknik untuk Membuktikan Pencampuran Cepat dalam Rantai Markov" oleh Bubley et al., Atau "Ketidaksetaraan Nash untuk rantai Markov yang terbatas" oleh Diaconis et al.
sumber