Merencanakan "permukaan median posterior"

8

Sebagai bagian dari mereproduksi model yang saya jelaskan sebagian dalam pertanyaan tentang Stack Overflow ini, saya ingin mendapatkan sebidang distribusi posterior. Model (spasial) menggambarkan harga jual beberapa properti sebagai distribusi Bernoulli tergantung pada apakah properti itu mahal (1) atau murah (0). Dalam persamaan:

ysayaBernoulli(halsaya)
halsayalogit-1(b0+b1LivingArea/1000+b2Usia+w(s))
w(s)MVN(0,Σ)

di mana adalah hasil biner 1 atau 0, adalah probabilitas menjadi murah atau mahal, adalah variabel acak spasial di mana mewakili posisinya . Semua ini untuk setiap karena ada 70 properti dalam dataset. adalah matriks kovarians berdasarkan posisi geografis dari titik data. Jika Anda penasaran dengan model ini, dataset dapat ditemukan di sini .ysayahalsayaw(s)ssaya={1,...,70}Σ

Plot yang ingin saya dapatkan adalah plot kontur berikut:

masukkan deskripsi gambar di sini

Gambar tersebut digambarkan sebagai "Gambar plot permukaan median posterior dari proses laten , model spasial biner". Buku itu juga mengatakan ini:w(s)

Gambar 5.8 menunjukkan plot gambar dengan garis kontur overlay untuk permukaan rata-rata posterior dari proses laten .w(s)

Namun, hanya ada 70 pasang poin dalam dataset. Saya kira itu, untuk menghasilkan plot kontur, saya perlu memperkirakanw(s)dalam 70 * 70 poin. Jadi, pertanyaan saya adalah: Bagaimana cara menghasilkan permukaan median posterior ini? Sejauh ini saya memiliki sampel distribusi posterior untuk semua parameter yang terlibat (menggunakan PyMC) dan saya tahu bahwa saya dapat memprediksiypada titik baru menggunakan distribusi prediksi posterior. Namun, saya tidak tahu cara memprediksi nilaiw(s) pada titik baru s. Mungkin saya salah dan plotnya tidak dibangun oleh prediksi tetapi oleh interpolasi.

PEMBARUAN :

Pertama, ini adalah median dari distribusi posterior w(s)di setiap lokasi di mana ada properti. Ini didasarkan pada jejak MCMC untukw.

masukkan deskripsi gambar di sini

Dan ini adalah interpolasi (dengan plot kontur) menggunakan fungsi basis radial:

masukkan deskripsi gambar di sini

(Jika Anda tertarik dengan kode ini, beri tahu saya)

Seperti yang Anda lihat, ada perbedaan yang signifikan dalam plot. Beberapa pertanyaan:

  1. Bagaimana saya bisa tahu jika perbedaan ini dijelaskan oleh prosedur interpolasi?

  2. Mungkin, ada variasi penting dalam distribusi posterior w(s)yang saya hitung dan yang ditunjukkan di buku. Berapa banyak variasi yang dapat diterima antara simulasi MCMC? Bahkan parameter saya sendiri berubah sedikit tergantung pada sampel yang saya gunakan (Metropolis, Metropolis Adaptive.)

  3. Apakah ada beberapa prosedur Bayesian untuk memprediksi poin w(s) untuk menghasilkan plot kontur seperti yang saya lakukan menggunakan fungsi basis radial?

Robert Smith
sumber
1
Interpolasi adalah prediksi! (Karenaw adalah suatu proses, muncul dengan nilai wdi setiap lokasi yang tidak diobservasi sama dengan menebak nilai variabel acak. Prediksi, menurut definisi, adalah menebak nilai dari variabel acak.)
whuber
Tentu. Saya bermaksud mengatakan interpolasi yang bertentangan dengan prediksi Bayesian. Ngomong-ngomong, saya mencoba menggunakan interpolasi dengan tetangga terdekat dan saya mendapat hasil yang mengerikan.
Robert Smith
Anda mungkin harus mendapatkan hasil yang mengerikan jika Anda menggunakan data mentah dalam program interpolasi, karena itu memecahkan masalah yang berbeda. Anda ingin plot kontur hanya untukw istilah tetapi program itu (saya kira) menggunakan ysaya.
whuber
Tidak, saya menggunakan median distribusi posterior untuk masing-masing w(s).
Robert Smith
Di mana lokasi spasial sapakah Anda menghitung median distribusi posterior? Saya percaya motivasi utama di balik menjalankan model semacam ini adalah untuk melacak distribusiw(s)di semua titik di mana Anda tertarik untuk memprediksi nilainya, yang - dalam kasus peta kontur ini - akan menjadi semua 4900 node grid.
whuber

Jawaban:

1

Sangat mungkin bahwa penulis menggunakan proses Gaussian untuk menghasilkan interpolasi. Saya pikir itu benar karena latihan dalam buku ini menggambarkan masalah yang sangat mirip dengan yang satu ini dan membutuhkan plot berdasarkan proses Gaussian.

Saya mencobanya dan saya pikir plot yang dihasilkan memiliki fitur dengan permukaan median posterior dari pertanyaan awal. Ini adalah median dari distribusi posteriorw(s) seperti di atas (ini sedikit berbeda karena saya menjalankan simulasi MCMC lain):

masukkan deskripsi gambar di sini

Dan ini adalah interpolasi berdasarkan proses Gaussian:

masukkan deskripsi gambar di sini

Seperti yang Anda lihat, metode interpolasi membuat perbedaan besar.

Robert Smith
sumber