MCMC; Bisakah kita yakin bahwa kita memiliki sampel "murni" dan "cukup besar" dari posterior? Bagaimana cara kerjanya jika kita tidak?

12

Mengacu pada utas ini: Bagaimana Anda menjelaskan Markov Chain Monte Carlo (MCMC) kepada orang awam? .

Saya dapat melihat bahwa itu adalah kombinasi dari Rantai Markov dan Monte Carlo: rantai Markov dibuat dengan posterior sebagai distribusi pembatas yang tidak berubah dan kemudian pengundian Monte Carlo (tergantung) dibuat dari distribusi pembatas (= posterior kami).

Katakanlah (saya tahu bahwa saya menyederhanakan di sini) bahwa setelah langkah kita berada pada distribusi membatasi (*).LΠ

Rantai Markov menjadi urutan variabel acak, saya mendapatkan urutan , di mana adalah variabel acak dan adalah pembatasnya ' 'variabel acak' 'dari mana kami ingin sampel. X1,X2,,XL,Π,Π,Π,ΠXiΠ

MCMC dimulai dari nilai awal, yaitu adalah variabel acak dengan semua massa pada satu nilai . Jika saya menggunakan huruf kapital untuk variabel acak dan huruf kecil untuk realisasi variabel acak, maka MCMC memberi saya urutan . Jadi panjang rantai MCMC adalah L + n.X1x1x1,x2,x3,xL,π1,π2,π3,....πn

[[* Catatan: huruf kapital adalah variabel acak (yaitu sejumlah besar hasil) dan kecil adalah hasil, yaitu satu nilai tertentu. *]]x

Jelas, hanya milik '' posterior '' saya dan untuk mendekati posterior '' well '' nilai harus '' cukup besar ''.πin

Jika saya meringkas ini maka saya memiliki rantai MCMC dengan panjang , hanya relevan untuk perkiraan posterior saya, dan harus cukup besar.x1,x2,x3,xL,π1,π2,π3,....πnN=L+nπ1,π2,,πnn

Jika saya menyertakan beberapa (yaitu realisasi sebelum distribusi invarian tercapai) dalam perhitungan perkiraan posterior, maka itu akan menjadi '' berisik ''.xi

Saya tahu panjang rantai MCMC , tetapi tanpa sepengetahuan , yaitu langkah di mana saya yakin untuk mengambil sampel dari distribusi yang membatasi, saya tidak bisa memastikan bahwa saya tidak memasukkan noise, saya juga tidak bisa pastikan tentang , ukuran sampel saya dari distribusi terbatas, khususnya, saya tidak bisa memastikan apakah itu '' cukup besar ''. N=L+nLn=NL

Jadi, sejauh yang saya mengerti, nilai ini sangat penting untuk kualitas perkiraan posterior (pengecualian kebisingan dan sampel besar dari itu)L .

Apakah ada cara untuk menemukan perkiraan yang masuk akal untuk ketika saya menerapkan MCMC?L

(*) Saya pikir, secara umum, akan tergantung pada nilai awal .Lx1

Komunitas
sumber

Jawaban:

6

TL DR; Anda tidak dapat memperkirakanLL=N


Pada dasarnya, pertanyaan Anda bermuara pada "bagaimana kita dapat memperkirakan waktu burn-in?". Burn-in adalah tindakan membuang sampel awal karena rantai Markov belum bertemu. Ada banyak diagnostik MCMC yang membantu Anda memperkirakan waktu "burn-in", Anda dapat melihat ulasannya di sini .

LLL

Sekarang, saya beralih ke detail yang lebih teknis dari pertanyaan Anda.

LLLL

LL

LNX1,X2,X3,,XNLLθ

θ¯N=1Ni=1NXi.

NL

Nθ

(θ¯Nθ)N

N(θ¯Nθ)dNp(0,Σ),

θRpΣ

Σ/N

Greenparker
sumber
LΣ/nθ^N
Σ/Nθ¯N
X1πg¯n
X1ππ