Perbedaan sederhana antara keduanya adalah bahwa distribusi posterior tergantung pada parameter tidak diketahui , yaitu distribusi posterior adalah:
mana c adalah konstanta normalisasi.θp ( θ | x ) = c × p ( x | θ ) p ( θ )
c
Sementara di sisi lain, distribusi prediksi posterior tidak tergantung pada yang tidak diketahui parameter θ karena telah terintegrasi keluar, yaitu, distribusi prediksi posterior adalah:
p ( x∗| x)= ∫Θc × p ( x∗, θ | x ) dθ = ∫Θc × p ( x∗| θ)p(θ | x)dθ
di mana x∗ adalah variabel acak baru yang tidak teramati dan independen dari x .
Saya tidak akan membahas penjelasan distribusi posterior karena Anda mengatakan Anda memahaminya tetapi distribusi posterior "adalah distribusi kuantitas yang tidak diketahui, diperlakukan sebagai variabel acak, tergantung pada bukti yang diperoleh" (Wikipedia). Jadi pada dasarnya ini adalah distribusi yang menjelaskan parameter tidak dikenal, acak, Anda.
Di sisi lain, distribusi prediktif posterior memiliki arti yang sama sekali berbeda dalam hal itu adalah distribusi untuk data prediksi di masa mendatang berdasarkan data yang telah Anda lihat. Jadi distribusi prediksi posterior pada dasarnya digunakan untuk memprediksi nilai data baru.
Jika itu membantu, adalah contoh grafik dari distribusi posterior dan distribusi prediksi posterior:
Distribusi prediktif biasanya digunakan ketika Anda telah mempelajari distribusi posterior untuk parameter semacam model prediksi. Misalnya dalam regresi linier Bayesian, Anda mempelajari distribusi posterior di atas parameter w dari model y = wX diberikan beberapa data yang diamati X.
Kemudian ketika titik data baru yang tidak terlihat x * masuk, Anda ingin mencari distribusi melalui prediksi yang mungkin y * diberikan distribusi posterior untuk w yang baru saja Anda pelajari. Distribusi ini melebihi kemungkinan y * yang diberikan posterior untuk w adalah distribusi prediksi.
sumber
Mereka merujuk pada distribusi dua hal yang berbeda.
Distribusi posterior mengacu pada distribusi parameter , sedangkan distribusi posterior prediktif (PPD) mengacu pada distribusi pengamatan data masa depan .
sumber