Sebagai bagian dari mereproduksi model yang saya jelaskan sebagian dalam pertanyaan tentang Stack Overflow ini, saya ingin mendapatkan sebidang distribusi posterior. Model (spasial) menggambarkan harga jual beberapa properti sebagai distribusi Bernoulli tergantung pada apakah properti itu mahal (1) atau murah (0). Dalam persamaan:
di mana adalah hasil biner 1 atau 0, adalah probabilitas menjadi murah atau mahal, adalah variabel acak spasial di mana mewakili posisinya . Semua ini untuk setiap karena ada 70 properti dalam dataset. adalah matriks kovarians berdasarkan posisi geografis dari titik data. Jika Anda penasaran dengan model ini, dataset dapat ditemukan di sini .
Plot yang ingin saya dapatkan adalah plot kontur berikut:
Gambar tersebut digambarkan sebagai "Gambar plot permukaan median posterior dari proses laten , model spasial biner". Buku itu juga mengatakan ini:
Gambar 5.8 menunjukkan plot gambar dengan garis kontur overlay untuk permukaan rata-rata posterior dari proses laten .
Namun, hanya ada 70 pasang poin dalam dataset. Saya kira itu, untuk menghasilkan plot kontur, saya perlu memperkirakandalam 70 * 70 poin. Jadi, pertanyaan saya adalah: Bagaimana cara menghasilkan permukaan median posterior ini? Sejauh ini saya memiliki sampel distribusi posterior untuk semua parameter yang terlibat (menggunakan PyMC) dan saya tahu bahwa saya dapat memprediksipada titik baru menggunakan distribusi prediksi posterior. Namun, saya tidak tahu cara memprediksi nilai pada titik baru . Mungkin saya salah dan plotnya tidak dibangun oleh prediksi tetapi oleh interpolasi.
PEMBARUAN :
Pertama, ini adalah median dari distribusi posterior di setiap lokasi di mana ada properti. Ini didasarkan pada jejak MCMC untuk.
Dan ini adalah interpolasi (dengan plot kontur) menggunakan fungsi basis radial:
(Jika Anda tertarik dengan kode ini, beri tahu saya)
Seperti yang Anda lihat, ada perbedaan yang signifikan dalam plot. Beberapa pertanyaan:
Bagaimana saya bisa tahu jika perbedaan ini dijelaskan oleh prosedur interpolasi?
Mungkin, ada variasi penting dalam distribusi posterior yang saya hitung dan yang ditunjukkan di buku. Berapa banyak variasi yang dapat diterima antara simulasi MCMC? Bahkan parameter saya sendiri berubah sedikit tergantung pada sampel yang saya gunakan (Metropolis, Metropolis Adaptive.)
Apakah ada beberapa prosedur Bayesian untuk memprediksi poin untuk menghasilkan plot kontur seperti yang saya lakukan menggunakan fungsi basis radial?
sumber
Jawaban:
Sangat mungkin bahwa penulis menggunakan proses Gaussian untuk menghasilkan interpolasi. Saya pikir itu benar karena latihan dalam buku ini menggambarkan masalah yang sangat mirip dengan yang satu ini dan membutuhkan plot berdasarkan proses Gaussian.
Saya mencobanya dan saya pikir plot yang dihasilkan memiliki fitur dengan permukaan median posterior dari pertanyaan awal. Ini adalah median dari distribusi posteriorw ( s ) seperti di atas (ini sedikit berbeda karena saya menjalankan simulasi MCMC lain):
Dan ini adalah interpolasi berdasarkan proses Gaussian:
Seperti yang Anda lihat, metode interpolasi membuat perbedaan besar.
sumber