Ide dasar dari memperbarui Bayesian adalah bahwa diberikan beberapa data X dan sebelum parameter lebih menarik θ , di mana hubungan antara data dan parameter dijelaskan menggunakan kemungkinan fungsi, Anda menggunakan teorema Bayes untuk mendapatkan posterior
p(θ∣X)∝p(X∣θ)p(θ)
Ini dapat dilakukan secara berurutan, di mana setelah melihat titik data pertama sebelum θ diperbarui ke posterior θ ′ , selanjutnya Anda dapat mengambil titik data kedua x 2 dan menggunakan posterior yang diperoleh sebelum θ ′ sebagai sebelumnya , untuk memperbaruinya sekali lagi dll.x1 θ θ′x2θ′
Biarkan saya memberi Anda sebuah contoh. Bayangkan bahwa Anda ingin memperkirakan rata-rata dari distribusi normal dan σ 2 diketahui oleh Anda. Dalam kasus seperti itu kita dapat menggunakan model normal-normal. Kami menganggap sebelumnya normal untuk μ dengan hiperparameter μ 0 , σ 2 0 :μσ2μμ0,σ20:
X∣μμ∼Normal(μ, σ2)∼Normal(μ0, σ20)
Karena distribusi normal adalah konjugat sebelum untuk distribusi normal, kami memiliki solusi bentuk-tertutup untuk memperbarui sebelumnyaμ
E(μ′∣x)Var(μ′∣x)=σ2μ+σ20xσ2+σ20=σ2σ20σ2+σ20
Sayangnya, solusi bentuk tertutup sederhana seperti itu tidak tersedia untuk masalah yang lebih canggih dan Anda harus mengandalkan algoritma pengoptimalan (untuk estimasi titik menggunakan maksimum pendekatan posteriori ), atau simulasi MCMC.
Di bawah ini Anda dapat melihat contoh data:
n <- 1000
set.seed(123)
x <- rnorm(n, 1.4, 2.7)
mu <- numeric(n)
sigma <- numeric(n)
mu[1] <- (10000*x[i] + (2.7^2)*0)/(10000+2.7^2)
sigma[1] <- (10000*2.7^2)/(10000+2.7^2)
for (i in 2:n) {
mu[i] <- ( sigma[i-1]*x[i] + (2.7^2)*mu[i-1] )/(sigma[i-1]+2.7^2)
sigma[i] <- ( sigma[i-1]*2.7^2 )/(sigma[i-1]+2.7^2)
}
Jika Anda memplot hasilnya, Anda akan melihat bagaimana posterior mendekati nilai estimasi (nilai sebenarnya ditandai dengan garis merah) ketika data baru diakumulasikan.
Untuk mempelajari lebih lanjut, Anda dapat memeriksa slide-slide dan analisis Conjugate Bayesian dari kertas distribusi Gaussian oleh Kevin P. Murphy. Periksa juga Apakah prior Bayesian menjadi tidak relevan dengan ukuran sampel yang besar? Anda juga dapat memeriksa catatan itu dan entri blog ini untuk pengantar inferensi langkah demi langkah yang dapat diakses dari Bayesian.
Kasus konjugasi prior (di mana Anda sering mendapatkan formula form tertutup yang bagus)
Tabel distribusi konjugasi dapat membantu membangun intuisi (dan juga memberikan beberapa contoh instruktif untuk bekerja melalui diri Anda sendiri).
sumber
Ini adalah masalah perhitungan pusat untuk analisis data Bayesian. Itu benar-benar tergantung pada data dan distribusi yang terlibat. Untuk kasus sederhana di mana semuanya dapat diekspresikan dalam bentuk tertutup (misalnya, dengan prior konjugat), Anda dapat menggunakan teorema Bayes secara langsung. Keluarga teknik yang paling populer untuk kasus yang lebih kompleks adalah rantai Markov Monte Carlo. Untuk detailnya, lihat buku teks pengantar tentang analisis data Bayesian.
sumber