Saya sedang menjalani beberapa kuliah yang berhubungan dengan MCMC. Namun, saya tidak menemukan contoh yang baik tentang bagaimana ini digunakan. Adakah yang bisa memberi saya contoh nyata. Yang bisa saya lihat adalah mereka menjalankan rantai Markov dan mengatakan bahwa distribusi stasionernya adalah distribusi yang diinginkan.
Saya ingin contoh yang bagus di mana distribusi yang diinginkan sulit untuk diambil sampelnya. Jadi kami membuat rantai Markov. Saya ingin tahu bagaimana memilih matriks transisi sehingga distribusi stasionernya, dari rantai Markov adalah target distribusi Terima kasih
probability
bayesian
mcmc
markov-process
pengguna34790
sumber
sumber
Jawaban:
Contoh distribusi yang sulit untuk diambil sampelnya adalah model Hard-Core, lihat halaman ini untuk tinjauan umum:
http://www.mathematik.uni-ulm.de/stochastik/lehre/ss06/markov/skript_engl/node34.html
Model ini mendefinisikan distribusi lebih dari grid untuk beberapa n tetapn × n n , di mana pada setiap titik di kisi Anda dapat memiliki nilai salah satu atau nol. Agar kisi dapat diterima di bawah model hard-core, tidak ada dua titik yang berdekatan pada kisi yang keduanya dapat memiliki nilai 1.
Gambar di bawah ini menunjukkan contoh diterima konfigurasi untuk kotak di bawah model hard-core. Dalam gambar ini yang ditampilkan sebagai titik-titik hitam, dan nol sebagai putih. Perhatikan bahwa tidak ada dua titik hitam yang berdekatan.8 × 8
Saya percaya inspirasi untuk model ini berasal dari fisika, Anda dapat menganggap setiap posisi dalam grid sebagai partikel, dan nilai pada posisi tersebut mewakili muatan listrik, atau putaran.
Kami ingin mengambil sampel secara seragam dari populasi kisi yang dapat diterima, yaitu jika adalah himpunan kisi yang dapat diterima, kami ingin mengambil sampel e ∈ E sedemikian rupa sehinggaE e∈E
dimana adalah jumlah semua kemungkinan konfigurasi yang diizinkan.| E|
Sudah ini menyajikan tantangan, mengingat bahwa kita sedang mempertimbangkan grid, bagaimana kita dapat menentukan | E | jumlah grid yang dapat diterima?n × n | E|
Salah satu hal yang menyenangkan tentang MCMC, adalah memungkinkan Anda untuk mengambil sampel dari distribusi di mana konstanta normalisasi sulit atau tidak mungkin untuk dievaluasi.
Saya akan membiarkan Anda membaca makalah tentang rincian cara menerapkan MCMC untuk masalah ini, tetapi relatif mudah.
sumber
Saya pikir contoh terbaik yang bisa saya berikan kepada Anda adalah ini:
Contoh Markov Chain Monte Carlo oleh Murali Haran
Yang mencakup beberapa kode bermanfaat dalam R.
Saya pikir saya bisa mereproduksi artikel di sini, tetapi tidak masuk akal.
sumber
Masalah menakutkan lainnya dalam statistik. Pertanyaannya sudah lama, tetapi contoh pengantar online sulit didapat. Jadi izinkan saya menyederhanakan dua contoh hebat untuk berjaga-jaga seandainya seseorang mengikuti perjalanan acak Markov dari tanah PageRank di sini dibingungkan oleh MCMC, dan penuh antisipasi untuk jawaban yang mudah diikuti. Bagaimana mungkin? Itu bisa menjadi pertanyaan lanjutan.
Kesulitannya adalah dalam mewujudkan bahwa setelah melalui semua langkah mekanik, hanya ada satu trik ajaib: keputusan biner menerima atau menolak suatu nilai yang diajukan .
mean
sd
rnorm(10000)
eps
runif(1, - eps, eps)
Setiap nilai yang diusulkan akan berbeda dari nilai sebelumnya secara acak, dan dalam batas-batas
[- eps,+ eps]
.min(1, dnorm(candidate_value)/dnorm(x))
min(1, ...)
dnorm
min(1, dnorm(candidate_value)/dnorm(x))
runif(1)
x[i+1]
x[i]
sd
x = 0; vec[1] = x
Ini lebih menarik, dan membuat referensi untuk memperkirakan parameter kurva regresi linier dengan menghitung kemungkinan log untuk parameter acak yang diberikan dataset . Namun, penafsiran garis kode dibangun dalam simulasi terkondensasi yang disimpan di sini , mengikuti langkah-langkah yang sangat mirip dengan contoh pertama.
sumber
Video Youtube ini adalah visualisasi yang sangat bagus dari masalah sederhana yang diselesaikan menggunakan MCMC.
Distribusi bunga adalah distribusi posterior atas kemiringan yang mungkin dan mencegat dalam regresi linier (panel kanan atas). Beberapa kombinasi lereng dan intersepsi sangat mungkin (yaitu mereka memiliki kemungkinan tinggi menghasilkan poin data yang diamati dan konsisten dengan harapan a priori kami ), sehingga mereka harus disampel secara berkala. Kombinasi lainnya tidak mungkin (mis. Jika sesuai dengan garis biru yang tidak melewati awan titik data), dan harus disampel lebih jarang.
Panel besar di kiri bawah menunjukkan jalur yang diambil oleh rantai Markov melalui ruang dua dimensi lereng dan penyadapan. Histogram menunjukkan ringkasan satu dimensi dari kemajuan rantai sejauh ini. Setelah rantai berjalan cukup lama, kami memiliki perkiraan distribusi yang sangat baik untuk kemungkinan nilai lereng dan intersep.
Dalam hal ini, MCMC berlebihan, tetapi ada beberapa masalah di mana solusi sulit untuk dituliskan dan sangat masuk akal untuk mengeksplorasi kemungkinan dengan rantai Markov daripada mencoba menyelesaikannya secara langsung.
sumber