Bagaimana seseorang menggunakan teorema Bayes dengan prior sebelumnya?

8

Jika prior saya dimodelkan sebagai distribusi probabilitas kontinu, katakanlah, distribusi beta condong untuk mencerminkan bias saya terhadap model-model tertentu, bagaimana saya bisa menghitung probabilitas posterior?

Tantangan bagi saya adalah menghitung probabilitas model yang diberikan, karena distribusi kontinu hanya akan memberi saya perkiraan untuk interval .

Tolong maafkan kenaifan pertanyaan, Saya baru saja mulai mempelajari statistik Bayesian.

Rafa
sumber
Saya kira pertanyaan yang benar adalah "Bagaimana saya bisa menghitung probabilitas model yang diberikan sampel data?" Saya dapat dengan mudah menghitung probabilitas data yang diberikan model, tetapi saya tidak tahu bagaimana memperkirakan probabilitas model. Dan ya, saya tertarik pada perbandingan model.
Rafa

Jawaban:

3

Untuk membandingkan model, katakan dan jawaban klasik Bayesian adalah (Jeffreys, 1939) untuk menghasilkan faktor Bayes Ketika lebih besar dari data berpihak pada model ; ketika lebih kecil dari , data mendukung model .

M1={f1(|θ1); θ1Θ1}
M2={f2(|θ2); θ2Θ2}
B12(x)=Θ1f1(x|θ1)π1(dθ1)Θ2f2(x|θ2)π2(dθ2)
B12(x)1M1B12(x)1M2
Xi'an
sumber
6

Teorema Bayes adalah:

P(A|B)=P(B|A)P(A)P(B)

Dalam kasus di mana Anda memiliki beberapa data dan parameter, adalah umum untuk menggunakan untuk parameter (atau parameter vektor) dan untuk data.θx

Anda mungkin menempatkan prior pada , , dan Anda mungkin memiliki model yang memberikan kemungkinan data Anda diberikan model. Anda kemudian dapat menggunakan aturan / teorema Bayes untuk "membalikkan" ini dan mendapatkan .θp(θ)p(x|θ)p(θ|x)

Hanya dalam satu set contoh yang relatif kecil adalah mungkin untuk mendapatkan solusi form tertutup untuk . Untuk kasus arbitrer, seringkali Anda memperkirakan distribusi posterior menggunakan beberapa metode standar dalam statistik Bayesian - misalnya, dua pendekatan luas yang paling umum adalah rantai markov monte carlo atau variational Bayes.p(θ|x)

Misalkan Anda tertarik pada kasus sederhana di mana posterior bentuk tertutup ada. Contohnya adalah jika adalah standar normal (Gaussian dengan varians unit dan rata-rata nol) dan adalah normal dengan nilai rata-rata dan varians unit.p(θ)p(x|θ)θ

Saya akan menghilangkan faktor normalisasi untuk kenyamanan. Juga catat bahwa penyebut dalam aturan Bayes cenderung untuk hanya melakukan renormalisasi hal-hal: Ayo gabungkan eksponen dan lengkapi kotak Ingatlah bahwa x diperbaiki di sini karena telah diamati dan kami berharap jawaban kami akan sesuai dengan itu. Lengkapi kotak dan lihat bahwa eksponen adalah dengan ketentuan lain yang bergantung pada x. Jadi:

p(θ|x)e(xθ)2/2eθ2/2
(xθ)2/2θ2/2(x22θx+θ2)θ2
(θx/2)2
p(θ|x)ea(θx/2)2

di mana 'a' adalah faktor yang bisa diperoleh dengan pembukuan. Perhatikan bahwa posterior adalah distribusi normal dengan nilai rata-rata x / 2. Cobalah menghitung varians untuk Anda sendiri.

Perhatikan bahwa jawaban kami masuk akal secara intuitif ... yang sebelumnya mengatakan bahwa adalah nol dan kami mengamati sampel yang memiliki nilai yang diharapkan dari . Karena varians dari prior dan distribusi besarnya sama, kami mempercayai mereka secara merata. Dengan demikian, posterior kami adalah distribusi dengan rata-rata yang adalah rata-rata dan 0 dan yang akhirnya memiliki varian lebih kecil dari awal atau (tidak ditampilkan di sini). θxθp(x|θ)xp(x|θ)p(x)

Untuk perbandingan model, Anda dapat melihat rasio:

p(x|θ1)p(x|θ2)

Ini disebut rasio kemungkinan (lihat wikipedia atau di tempat lain). Di sini Anda tidak perlu posterior, Anda hanya melihat bagaimana (relatif) kemungkinan data Anda (atau pengamatan) diberikan baik atau menjadi parameter model yang menghasilkan pengamatan Anda. θ1θ2

Semoga ini membantu.

Josh
sumber
Maaf jawaban Anda salah. Faktor Bayes tidak didefinisikan seperti ini!
Xi'an
Untuk perbandingan model, saya menggambarkan rasio kemungkinan. Awalnya saya keliru menggunakan faktor Bayes.
Josh
Kecuali Anda tidak tahu dan yang menghasilkan pengamatan. θ1θ2
Xi'an
Hanya dimaksudkan untuk menggambarkan kasus sederhana di mana Anda memiliki dua nilai hipotetis dari parameter model dan Anda ingin membandingkan seberapa baik data mengikuti dari mereka. Setuju bahwa jika Anda memiliki dua bentuk model dan ingin membandingkannya tanpa mengetahui parameter tertentu, jawaban Anda memberikan pendekatan yang benar.
Josh