Jika prior saya dimodelkan sebagai distribusi probabilitas kontinu, katakanlah, distribusi beta condong untuk mencerminkan bias saya terhadap model-model tertentu, bagaimana saya bisa menghitung probabilitas posterior?
Tantangan bagi saya adalah menghitung probabilitas model yang diberikan, karena distribusi kontinu hanya akan memberi saya perkiraan untuk interval .
Tolong maafkan kenaifan pertanyaan, Saya baru saja mulai mempelajari statistik Bayesian.
Jawaban:
Untuk membandingkan model, katakan dan jawaban klasik Bayesian adalah (Jeffreys, 1939) untuk menghasilkan faktor Bayes Ketika lebih besar dari data berpihak pada model ; ketika lebih kecil dari , data mendukung model .
sumber
Teorema Bayes adalah:
Dalam kasus di mana Anda memiliki beberapa data dan parameter, adalah umum untuk menggunakan untuk parameter (atau parameter vektor) dan untuk data.θ x
Anda mungkin menempatkan prior pada , , dan Anda mungkin memiliki model yang memberikan kemungkinan data Anda diberikan model. Anda kemudian dapat menggunakan aturan / teorema Bayes untuk "membalikkan" ini dan mendapatkan .θ p(θ) p(x|θ) p(θ|x)
Hanya dalam satu set contoh yang relatif kecil adalah mungkin untuk mendapatkan solusi form tertutup untuk . Untuk kasus arbitrer, seringkali Anda memperkirakan distribusi posterior menggunakan beberapa metode standar dalam statistik Bayesian - misalnya, dua pendekatan luas yang paling umum adalah rantai markov monte carlo atau variational Bayes.p(θ|x)
Misalkan Anda tertarik pada kasus sederhana di mana posterior bentuk tertutup ada. Contohnya adalah jika adalah standar normal (Gaussian dengan varians unit dan rata-rata nol) dan adalah normal dengan nilai rata-rata dan varians unit.p(θ) p(x|θ) θ
Saya akan menghilangkan faktor normalisasi untuk kenyamanan. Juga catat bahwa penyebut dalam aturan Bayes cenderung untuk hanya melakukan renormalisasi hal-hal: Ayo gabungkan eksponen dan lengkapi kotak Ingatlah bahwa x diperbaiki di sini karena telah diamati dan kami berharap jawaban kami akan sesuai dengan itu. Lengkapi kotak dan lihat bahwa eksponen adalah dengan ketentuan lain yang bergantung pada x. Jadi:
di mana 'a' adalah faktor yang bisa diperoleh dengan pembukuan. Perhatikan bahwa posterior adalah distribusi normal dengan nilai rata-rata x / 2. Cobalah menghitung varians untuk Anda sendiri.
Perhatikan bahwa jawaban kami masuk akal secara intuitif ... yang sebelumnya mengatakan bahwa adalah nol dan kami mengamati sampel yang memiliki nilai yang diharapkan dari . Karena varians dari prior dan distribusi besarnya sama, kami mempercayai mereka secara merata. Dengan demikian, posterior kami adalah distribusi dengan rata-rata yang adalah rata-rata dan 0 dan yang akhirnya memiliki varian lebih kecil dari awal atau (tidak ditampilkan di sini).θ x θ p(x|θ) x p(x|θ) p(x)
Untuk perbandingan model, Anda dapat melihat rasio:
Ini disebut rasio kemungkinan (lihat wikipedia atau di tempat lain). Di sini Anda tidak perlu posterior, Anda hanya melihat bagaimana (relatif) kemungkinan data Anda (atau pengamatan) diberikan baik atau menjadi parameter model yang menghasilkan pengamatan Anda.θ1 θ2
Semoga ini membantu.
sumber