Interpretasi interval prediksi Bayesian 95%

9

Asumsikan model regresi bivariat berikut: mana adalah iid untuk .

yi=βxi+ui,
uiN(0,σ2=9)i=1,,n

Asumsikan sebelumnya noninformatif , maka dapat ditunjukkan bahwa pdf posterior untuk adalah manap(β)constantβ

p(β|y)=(18π)12(i=1nxi2)12exp[118i=1nxi2(ββ^)2],
β^=(i=1nyixi)/(i=1nxi2).

Sekarang pertimbangkan nilai dengan nilai , : mana iid , maka kita dapat menunjukkan bahwa adalah kepadatan normal dengan ekspektasi dan varian Dengan demikian fungsi kepadatan probabilitas posterior untuk , tergantung pada , adalah yxxn+1

yn+1=βxn+1+un+1,
un+1N(0,σ2=9)
p(yn+1|xn+1,y)=βp(yn+1|xn+1,β,y)p(β|y)dβ
E[yn+1|xn+1,y]=β^xn+1,var[yn+1|xn+1,y]=9[xn+12+i=1nxi2]i=1nxi2.
yn+1xn+1
p(yn+1|xn+1,y)=(18π[xn+12+i=1nxi2]i=1nxi2)12×exp{i=1nxi218(xn+12+i=1nxi2)(yn+1β^xn+1)2}

Sekarang pertanyaannya adalah: Tentukan interval prediksi 95% untuk yn+1 dan tafsirkan dengan cermat. Aspek apa dari proses pembuatan data yang gagal diakomodasikan oleh interval kita?


Saya tidak terlalu yakin tentang bagaimana menjawab pertanyaan tetapi inilah upaya saya:

Jadi pada dasarnya kita perlu menemukan beberapa dan sehinggaabP(a<yn+1<b)=abp(yn+1|xn+1,y)dyn+1=95%

Sekarang kita tahu bahwa mana dan , Oleh karena itu: yn+1|xn+1,yN(m,v2)m=E[yn+1|xn+1,y]v2=var[yn+1|xn+1,y]

yn+1mvN(0,1)
P(1.96<yn+1mv<1.96)=95%
P(1.96v+m<yn+1<1.96v+m)=95%

Sekarang karena kita mengkondisikan pada dan melihat ekspresi untuk dan , kita melihat bahwa dan adalah nilai yang diketahui. Jadi kita dapat mengambil dan . yaitu, kita dapat memilih banyak kemungkinan lain dari dan yang menghasilkan probabilitas ... tetapi bagaimana hal ini terkait dengan menjawab bagian dari pertanyaan yang menanyakan aspek proses pembuatan data apa yang gagal diakomodasi oleh interval ini?xn+1vmvma=1.96v+mb=1.96v+mab95%

TeTs
sumber
1
Silakan tambahkan tag belajar sendiri jika ini adalah pekerjaan rumah atau upaya untuk masalah buku teks.
Nick Cox
2
@Nick Cox Terima kasih telah memberi tahu saya, saya menambahkan tag belajar mandiri.
TeTs
Mungkinkah interval secara khusus tidak memberi kita pemahaman tentang bentuk proses pembuatan data? Artinya, kita tidak tahu kombinasi mean / varian hanya dari interval?
Pertanyaan aneh. Apakah ada konteks sebelum latihan? Mengapa Anda mengatakan model regresi bivariat ?
Stéphane Laurent

Jawaban:

2

Interval mengakomodasi semua ketidakpastian dalam masalah. Dalam uraian masalah Anda, satu-satunya hal yang tidak Anda ketahui adalah dan . Interval prediksi yang Anda peroleh mengakomodasi ketidakpastian dalam keduanya. Jadi tidak ada ketidakpastian yang tersisa untuk interval "gagal mengakomodasi".βu

Tom Minka
sumber
Masih ada ketidakpastian apakah model tersebut benar atau tidak.
Xi'an
1
Model tersebut dinyatakan sebagai asumsi. Karena itu tidak ada ketidakpastian tentang itu.
Tom Minka
Saya kira apa yang dimaksud adalah bahwa distribusi prediktif mewakili semua ketidakpastian dalam masalah dan interval hanya merangkum beberapa aspek dari distribusi itu. Namun, tidak jelas bahwa sebagai interval itu meninggalkan apa pun.
conjugateprior