Ketika bekerja dengan rantai Markov, Monte Carlo untuk menarik kesimpulan, kita membutuhkan rantai yang bercampur dengan cepat, yaitu bergerak melalui dukungan distribusi posterior dengan cepat. Tetapi saya tidak mengerti mengapa kita membutuhkan properti ini, karena dari apa yang saya pahami, gambar yang diterima menarik harus dan akan terkonsentrasi di bagian kepadatan tinggi dari distribusi posterior. Jika apa yang saya pahami benar, maka apakah kita masih ingin rantai bergerak melalui dukungan (yang termasuk bagian kepadatan rendah)?
Selain itu, jika saya menggunakan MCMC untuk melakukan optimasi, apakah saya masih perlu peduli tentang pencampuran cepat dan mengapa?
Terima kasih telah berbagi pemikiran Anda!
Jawaban:
Algoritma Monte Carlo yang ideal menggunakan nilai acak berturut-turut independen . Dalam MCMC, nilai-nilai berturut-turut tidak independen, yang membuat metode ini menyatu lebih lambat daripada Monte Carlo yang ideal; namun, semakin cepat campurannya, semakin cepat ketergantungan akan berurutan dalam iterasi yang berurutan¹, dan semakin cepat konvergen.
Mean Maksud saya di sini bahwa nilai-nilai berturut-turut dengan cepat "hampir tidak tergantung" dari keadaan awal, atau lebih tepatnya yang diberi nilai pada satu titik, nilai-nilai X ń + k menjadi cepat "hampir independen" dari X n ketika k tumbuh; jadi, seperti yang dikatakan qkhhly dalam komentar, "rantai tidak terus terjebak di wilayah tertentu dari ruang negara".Xn Xń +k Xn k
Sunting: Saya pikir contoh berikut dapat membantu
Bayangkan Anda ingin memperkirakan rata-rata distribusi seragam pada oleh MCMC. Anda mulai dengan urutan yang diurutkan ( 1 , … , n ) ; pada setiap langkah, Anda memilih k > 2 elemen dalam urutan dan acak secara acak. Pada setiap langkah, elemen di posisi 1 direkam; ini menyatu dengan distribusi seragam. Nilai k mengontrol kecepatan pencampuran: ketika k = 2 , itu lambat; ketika k = n , elemen berturut-turut independen dan pencampurannya cepat.{ 1 , … , n } ( 1 , … , n ) k > 2 k k = 2 k = n
Berikut adalah fungsi R untuk algoritma MCMC ini:
Mari kita terapkan untuk , dan plot estimasi berturut-turut dari μ = 50 di sepanjang iterasi MCMC:n = 99 μ = 50
Anda dapat melihat di sini bahwa untuk (hitam), konvergensi lambat; untuk k = 50 (berwarna biru), itu lebih cepat, tetapi masih lebih lambat daripada dengan k = 99 (berwarna merah).k = 2 k = 50 k = 99
Anda juga dapat memplot histogram untuk distribusi estimasi rata-rata setelah jumlah iterasi yang tetap, misalnya 100 iterasi:
sumber
Tentang komentar spesifik Anda itu
sumber
Anggapan yang memotivasi keinginan untuk rantai pencampuran cepat adalah bahwa Anda peduli tentang waktu komputasi dan bahwa Anda ingin sampel yang representatif dari posterior. Yang pertama akan tergantung pada kompleksitas masalah: jika Anda memiliki masalah kecil / sederhana, mungkin tidak masalah apakah algoritma Anda efisien. Yang terakhir ini sangat penting jika Anda tertarik pada ketidakpastian posterior atau mengetahui mean posterior dengan presisi tinggi. Namun, jika Anda tidak ingin memiliki sampel yang representatif dari posterior karena Anda hanya menggunakan MCMC untuk melakukan perkiraan optimasi, ini mungkin tidak terlalu penting bagi Anda.
sumber