Apa perbedaan antara distribusi prediktif posterior dan posterior?

31

Saya mengerti apa itu Posterior, tapi saya tidak yakin apa artinya yang terakhir?

Bagaimana 2 yang berbeda?

Kevin P Murphy ditunjukkan dalam buku pelajarannya, Machine Learning: a Probabilistic Perspective , bahwa itu adalah "keadaan kepercayaan internal". Apa maksudnya itu? Saya mendapat kesan bahwa Prior merupakan kepercayaan atau bias internal Anda, di mana saya salah?

IKLAN
sumber

Jawaban:

36

Perbedaan sederhana antara keduanya adalah bahwa distribusi posterior tergantung pada parameter tidak diketahui , yaitu distribusi posterior adalah: mana c adalah konstanta normalisasi.θ

hal(θ|x)=c×hal(x|θ)hal(θ)
c

Sementara di sisi lain, distribusi prediksi posterior tidak tergantung pada yang tidak diketahui parameter θ karena telah terintegrasi keluar, yaitu, distribusi prediksi posterior adalah:

hal(x|x)=Θc×hal(x,θ|x)dθ=Θc×hal(x|θ)hal(θ|x)dθ

di mana x adalah variabel acak baru yang tidak teramati dan independen dari x .

Saya tidak akan membahas penjelasan distribusi posterior karena Anda mengatakan Anda memahaminya tetapi distribusi posterior "adalah distribusi kuantitas yang tidak diketahui, diperlakukan sebagai variabel acak, tergantung pada bukti yang diperoleh" (Wikipedia). Jadi pada dasarnya ini adalah distribusi yang menjelaskan parameter tidak dikenal, acak, Anda.

Di sisi lain, distribusi prediktif posterior memiliki arti yang sama sekali berbeda dalam hal itu adalah distribusi untuk data prediksi di masa mendatang berdasarkan data yang telah Anda lihat. Jadi distribusi prediksi posterior pada dasarnya digunakan untuk memprediksi nilai data baru.

Jika itu membantu, adalah contoh grafik dari distribusi posterior dan distribusi prediksi posterior:

masukkan deskripsi gambar di sini

masukkan deskripsi gambar di sini

Jinhua Wang
sumber
3
Grafik distribusi prediktif posterior membutuhkan label sumbu baru dan keterangan atau sesuatu. Saya mendapatkan ide itu karena saya tahu apa itu distribusi prediksi posterior, tetapi seseorang yang baru mengetahuinya bisa sangat bingung.
Cyan
Terima kasih @BabakP bisakah Anda juga mengarahkan saya ke distribusi apa yang Anda gunakan untuk merencanakan PMF theta, dan P (x * | theta)
AD
... karena saya ingin mengetahui contoh lengkapnya.
AD
Saya hanya berpura-pura bahwa posterior saya adalah Beta (3,2). Saya sebenarnya tidak berhasil apa-apa. Tetapi tentu saja, jika Anda ingin contoh, asumsikan kemungkinannya adalah Binomial (n, p) dan sebelum p adalah Beta (a, b) maka Anda harus dapat memperoleh bahwa posterior sekali lagi merupakan distribusi beta. .
Selain itu, prediksi posterior itu tidak mudah didapat. Saya baru saja mengambil grafik dari beberapa kode Proses Gaussian yang saya tulis untuk prediksi posterior GP. Dan dengan mengatakan bahwa, posterior dan plot prediksi posterior di atas sebenarnya tidak sesuai dengan posterior yang ditunjukkan, mereka berdua sewenang-wenang.
11

Distribusi prediktif biasanya digunakan ketika Anda telah mempelajari distribusi posterior untuk parameter semacam model prediksi. Misalnya dalam regresi linier Bayesian, Anda mempelajari distribusi posterior di atas parameter w dari model y = wX diberikan beberapa data yang diamati X.
Kemudian ketika titik data baru yang tidak terlihat x * masuk, Anda ingin mencari distribusi melalui prediksi yang mungkin y * diberikan distribusi posterior untuk w yang baru saja Anda pelajari. Distribusi ini melebihi kemungkinan y * yang diberikan posterior untuk w adalah distribusi prediksi.

pengguna1893354
sumber
5

Mereka merujuk pada distribusi dua hal yang berbeda.

Distribusi posterior mengacu pada distribusi parameter , sedangkan distribusi posterior prediktif (PPD) mengacu pada distribusi pengamatan data masa depan .

SPMQET
sumber