Bisakah MCMC adaptif dipercaya?

20

Saya membaca tentang MCMC adaptif (lihat misalnya, Bab 4 dari Handbook of Markov Chain Monte Carlo , ed. Brooks et al., 2011; dan juga Andrieu & Thoms, 2008 ).

Hasil utama dari Roberts dan Rosenthal (2007) adalah bahwa jika skema adaptasi memenuhi kondisi adaptasi menghilang (ditambah beberapa teknis lainnya), MCMC adaptif adalah ergodik di bawah skema apa pun. Misalnya, menghilangkan adaptasi dapat dengan mudah diperoleh dengan mengadaptasi operator transisi pada iterasi dengan probabilitas , dengan .nhal(n)limnhal(n)=0

Hasil ini (a posteriori) intuitif, asimptotik. Karena jumlah adaptasi cenderung nol, akhirnya tidak akan mengacaukan ergodisitas. Kekhawatiran saya adalah apa yang terjadi dengan waktu yang terbatas .

  • Bagaimana kita tahu bahwa adaptasi tidak mengacaukan ergodisitas pada waktu tertentu, dan bahwa seorang sampel mengambil sampel dari distribusi yang benar? Jika itu masuk akal, berapa banyak pembakaran yang harus dilakukan untuk memastikan adaptasi awal tidak membiaskan rantai?

  • Apakah praktisi di lapangan percaya MCMC adaptif? Alasan saya bertanya adalah karena saya telah melihat banyak metode baru yang mencoba membangun adaptasi dengan cara lain yang lebih kompleks yang diketahui menghargai ergodisitas, seperti regenerasi atau metode ensemble (yaitu, sah untuk memilih transisi operator yang tergantung pada keadaan rantai paralel lainnya). Atau, adaptasi dilakukan hanya selama burn-in, seperti di Stan , tetapi tidak saat runtime. Semua upaya ini menunjukkan kepada saya bahwa MCMC adaptif sesuai Roberts dan Rosenthal (yang akan sangat sederhana untuk diterapkan) tidak dianggap dapat diandalkan; tapi mungkin ada alasan lain.

  • Bagaimana dengan implementasi spesifik, seperti adaptif Metropolis-Hastings ( Haario et al. 2001 )?


Referensi

Lacerbi
sumber
1
+1 tetapi apakah ada jaminan waktu terbatas bahkan untuk MCMC non-adaptif?
Juho Kokkala
2
@ JuhoKokkala: mungkin tidak, tetapi tampaknya dengan MCMC adaptif seseorang menambahkan lagi lapisan mode kegagalan yang mungkin, yang kurang dipahami dan lebih sulit untuk diperiksa daripada masalah konvergensi standar (yang sudah cukup sulit untuk didiagnosis per se). Setidaknya, itulah pemahaman saya tentang mengapa praktisi (saya, untuk satu) akan mewaspadai hal itu.
lacerbi
1
Saya pikir adaptasi selama pembakaran adalah cara terbaik untuk menghadapi adaptasi. Tentunya jika Anda memiliki beberapa area posterior Anda yang memerlukan penyetelan berbeda dari yang lain Anda akan memiliki masalah, tetapi jika itu masalahnya, jika Anda menjalankan MCMC yang sepenuhnya adaptif, Anda tidak akan diizinkan untuk beradaptasi banyak karena kondisi lenyapnya pula. .
sega_sai

Jawaban:

2

Bagaimana kita tahu bahwa adaptasi tidak mengacaukan ergodisitas pada waktu tertentu, dan bahwa seorang sampel mengambil sampel dari distribusi yang benar? Jika itu masuk akal, berapa banyak pembakaran yang harus dilakukan untuk memastikan adaptasi awal tidak membiaskan rantai?

Ergodisitas dan bias adalah tentang sifat asimptotik dari rantai Markov, mereka tidak mengatakan apa-apa tentang perilaku dan distribusi rantai Markov at a given finite time. Adaptivity tidak ada hubungannya dengan masalah ini, setiap algoritma MCMC dapat menghasilkan simulasi yang jauh dari target at a given finite time.

Xi'an
sumber
1
(+1) Terima kasih atas klarifikasi. Ya, saya mengerti bahwa algoritma MCMC tidak memiliki jaminan at a given finite time. Namun, dalam praktiknya kami menggunakannya seolah-olah mereka memberikan perkiraan yang baik / wajar dari target distribusi pada waktu tertentu, meskipun dalam kebanyakan kasus tidak ada jaminan teoritis (AFAIK hanya beberapa kasus yang dipahami secara matematis). Mungkin saya harus mengatakan "mengacaukan waktu percampuran "? Itu lebih dekat dengan apa yang saya maksudkan. Jika Anda memiliki saran tentang cara memperbaiki bahasa, beri tahu saya.
lacerbi