Pemeriksaan prediktif posterior adalah, dengan kata sederhana, "mensimulasikan data yang direplikasi di bawah model yang pas dan kemudian membandingkan ini dengan data yang diamati" ( Gelman dan Hill, 2007, hal. 158 ). Jadi, Anda menggunakan prediksi posterior untuk "mencari perbedaan sistematis antara data nyata dan simulasi" ( Gelman et al. 2004, hal. 169 ).
Argumen tentang "menggunakan data dua kali" adalah bahwa Anda menggunakan data Anda untuk memperkirakan model dan kemudian, untuk memeriksa apakah model cocok dengan data, sementara umumnya itu adalah ide yang buruk dan akan lebih baik untuk memvalidasi model Anda pada data eksternal , yang tidak digunakan untuk estimasi.
Pemeriksaan prediktif posterior sangat membantu dalam menilai apakah model Anda memberi Anda prediksi "valid" tentang kenyataan - apakah cocok dengan data yang diamati atau tidak. Ini adalah fase yang membantu dalam membangun dan memeriksa model. Itu tidak memberi Anda jawaban yang pasti tentang apakah model Anda "ok" atau jika "lebih baik" dari model lain, namun, ini dapat membantu Anda memeriksa apakah model Anda masuk akal.
Ini dijelaskan dengan baik dalam sketsa LaplacesDemon Bayesian Inference :
yreputasiy
Pemeriksaan prediktif posterior (melalui distribusi prediktif) melibatkan penggunaan ganda data, yang melanggar prinsip kemungkinan. Namun, argumen telah dibuat dalam mendukung pemeriksaan prediktif posterior, asalkan penggunaan terbatas pada ukuran perbedaan untuk mempelajari kecukupan model, bukan untuk perbandingan model dan inferensi (Meng 1994).
yreputasiyyyreputasi