Contoh kesalahan dalam algoritma MCMC

28

Saya sedang menyelidiki suatu metode untuk pengecekan otomatis metode rantai Monte Carlo Markov, dan saya ingin beberapa contoh kesalahan yang dapat terjadi ketika membangun atau mengimplementasikan algoritma tersebut. Poin bonus jika metode yang salah digunakan dalam makalah yang diterbitkan.

Saya terutama tertarik pada kasus-kasus di mana kesalahan berarti bahwa rantai memiliki distribusi invarian yang salah, meskipun jenis kesalahan lainnya (misalnya rantai tidak ergodik) juga akan menarik.

Contoh kesalahan seperti itu akan gagal menghasilkan nilai ketika Metropolis-Hastings menolak langkah yang diusulkan.

Simon Byrne
sumber
7
Salah satu contoh favorit saya adalah penduga rata-rata Harmonik karena memiliki sifat asimptotik yang bagus tetapi gagal dalam praktiknya. Radford Neal membahas hal ini di blognya: "Kabar buruknya adalah bahwa jumlah poin yang dibutuhkan penduga ini untuk mendekati jawaban yang tepat sering kali lebih besar daripada jumlah atom di alam semesta yang dapat diamati". Metode ini telah banyak diimplementasikan dalam aplikasi.
3
Satu lagi dari Prof. Neal.
Cyan
5
@Cyan Agar Neal dianggap serius, saya pikir dia seharusnya menemukan jurnal yang mau menerima artikelnya daripada hanya menyerahkannya di internet. Saya dapat dengan mudah percaya bahwa dia benar dan wasit dan penulis salah. Walaupun sulit untuk menerbitkan makalah yang bertentangan dengan hasil yang dipublikasikan dan penolakan JASA mengecewakan, saya pikir dia harus mencoba beberapa jurnal lain sampai dia berhasil. Anda memerlukan wasit yang tidak bela diri dan independen untuk menambah kredibilitas temuan Anda.
Michael R. Chernick
4
Orang harus selalu menganggap serius Prof. Neal! ; o) Sangat memalukan bahwa hasil seperti ini sulit untuk dipublikasikan, dan sayangnya budaya akademik modern tampaknya tidak menghargai hal semacam itu, jadi dapat dimengerti jika itu bukan kegiatan prioritas tinggi baginya. Pertanyaan yang menarik, saya sangat tertarik dengan jawabannya.
Dikran Marsupial
6
@Michael: Mungkin. Telah berada di semua sisi situasi yang serupa, termasuk dalam posisi Prof. Neal, dalam banyak kesempatan, pengamatan anekdotal saya adalah bahwa penolakan kertas membawa sangat, sangat sedikit kandungan informasi dalam banyak kasus, seperti halnya banyak penerimaan. Peer review adalah perintah yang besarnya lebih berisik daripada yang orang mau akui dan, seringkali, seperti yang terjadi di sini, ada pihak-pihak yang tertarik dan parsial (yaitu, tidak independen) dan minat yang berperan. Yang mengatakan, saya tidak bermaksud komentar asli saya untuk membawa kita sejauh ini tentang topik yang sedang dibahas. terima kasih berbagi pemikiran Anda tentang masalah ini.
kardinal

Jawaban:

11

1. Marginal Likelihood dan Harmonic mean estimator

The kemungkinan marginal didefinisikan sebagai konstanta normalisasi distribusi posterior

p(x)=Θp(x|θ)p(θ)dθ.

Pentingnya kuantitas ini berasal dari peran yang dimainkannya dalam perbandingan model melalui faktor Bayes .

Beberapa metode telah diusulkan untuk mendekati jumlah ini. Raftery et al. (2007) mengusulkan estimator Harmonic mean , yang dengan cepat menjadi populer karena kesederhanaannya. Idenya terdiri dari menggunakan relasi

1p(x)=Θp(θ|x)p(x|θ)dθ.

Oleh karena itu, jika kita memiliki sampel dari posterior, mengatakan , jumlah ini dapat didekati dengan(θ1,...,θN)

1p(x)1Nj=1N1p(x|θj).

Perkiraan ini terkait dengan konsep Importance Sampling .

Berdasarkan hukum angka besar, seperti yang dibahas di blog Neal , kami memiliki penaksir ini konsisten . Masalahnya adalah bahwa diperlukan untuk perkiraan yang baik bisa sangat besar. Lihat blog Neal atau blog Robert 1 , 2 , 3 , 4 untuk beberapa contoh.N

Alternatif

Ada banyak alternatif untuk mendekati . Chopin dan Robert (2008) menyajikan beberapa metode berbasis pengambilan sampel Importance.p(x)

2. Tidak menjalankan MCMC sampler Anda cukup lama (khususnya di hadapan multimodality)

Mendoza dan Gutierrez-Peña (1999) menyimpulkan referensi sebelum / posterior untuk rasio dua rata-rata normal dan menyajikan contoh kesimpulan yang diperoleh dengan model ini menggunakan set data nyata. Menggunakan metode MCMC, mereka mendapatkan sampel berukuran posterior dari rasio sarana φ yang ditunjukkan di bawah ini2000φ

masukkan deskripsi gambar di sini

φ (0.63,5.29)00

masukkan deskripsi gambar di sini

(0,7.25)

3. Beberapa masalah lain seperti menilai konvergensi, pilihan nilai awal, perilaku rantai yang buruk dapat ditemukan dalam diskusi ini oleh Gelman, Carlin dan Neal.

4. Pengambilan Sampel Penting

g

I=f(x)dx=f(x)g(x)g(x)dx.

g(x1,...,xN)I

I1Nj=1Nf(xj)g(xj).

gfN

# Integrating a Student's t with 1 d.f. using a normal importance function   
x1 = rnorm(10000000)   # N=10,000,000
mean(dt(x1,df=1)/dnorm(x1))

# Now using a Student's t with 2 d.f. function
x2 = rt(1000,df=2)
mean(dt(x2,df=1)/dt(x2,df=2))

sumber
2
Mereka adalah beberapa contoh yang bagus. Bagi siapa pun yang tertarik, surat kepada editor dengan gambar ada di sini: onlinelibrary.wiley.com/doi/10.1002/bimj.200800256/abstract
Simon Byrne
2
Ringkasan yang sangat bagus dan jelas !! (+1)
gui11aume
12

Darren Wilkinson di blognya memberikan contoh terperinci tentang kesalahan umum dalam perjalanan acak Metropolis-Hastings. Saya sarankan untuk membacanya secara penuh, tetapi ini adalah versi dr; tl;

Jika distribusi target positif (seperti distribusi Gamma, dll. ) Dalam satu dimensi, tergoda untuk langsung menolak proposal yang memiliki nilai negatif pada dimensi tersebut. Kesalahannya adalah membuang proposal seperti tidak pernah terjadi dan mengevaluasi rasio penerimaan Metropolis-Hastings (MH) dari yang lain saja. Ini adalah kesalahan karena sama dengan menggunakan kepadatan proposal yang tidak simetris.

Penulis menyarankan untuk menerapkan satu dari dua perbaikan.

  1. Hitung "negatif" sebagai penerimaan gagal (dan kehilangan sedikit efisiensi).

  2. Gunakan rasio MH yang benar dalam kasus itu, yaitu

π(x)π(x)Φ(x)Φ(x),

πΦϕ Φ(x)=0ϕ(yx)dy

gui11aume
sumber
1
+1 Contoh menarik. Saya juga memikirkan masalah lain dengan MH terkait dengan tingkat penerimaan. Saya pikir tingkat optimal 0,234 telah digunakan secara berlebihan.
@Prastrastator Anda tahu literatur MCMC dengan sangat baik. Apakah ini bidang keahlian Anda?
gui11aume
Terima kasih atas komentar Anda. Saya suka statistik Bayesian, maka saya perlu membawa salib MCMC;).
1

Kasus yang sangat jelas (terkait dengan perkiraan kemungkinan marjinal yang disebutkan dalam jawaban pertama) di mana konvergensi sejati adalah contoh dari masalah penggantian label dalam model campuran ditambah dengan penggunaan penaksir Chib (1995) . Seperti yang ditunjukkan oleh Radford Neal (1999), jika rantai MCMC tidak bertemu dengan benar, dalam arti bahwa itu mengeksplorasi beberapa mode distribusi target, perkiraan Monte Carlo dari Chib gagal mencapai nilai numerik yang tepat.

Xi'an
sumber