Dengan asumsi saya mengambil rata-rata distribusi posterior daripada sampel acak dari itu, apakah ini yang biasa disebut sebagai Rao-Blackwellization?
Saya tidak terlalu terbiasa dengan model volatilitas stokastik, tetapi saya tahu bahwa di sebagian besar pengaturan, alasan kami memilih algoritma Gibbs atau MH untuk menggambar dari posterior, adalah karena kami tidak tahu posterior. Seringkali kita ingin memperkirakan rata-rata posterior, dan karena kita tidak tahu rata-rata posterior, kita mengambil sampel dari posterior dan memperkirakannya menggunakan mean sampel. Jadi, saya tidak yakin bagaimana Anda akan dapat mengambil mean dari distribusi posterior.
Alih-alih, penduga Rao-Blackwellized bergantung pada pengetahuan tentang rata-rata kondisi penuh; namun demikian pengambilan sampel masih diperlukan. Saya jelaskan lebih lanjut di bawah ini.
Misalkan distribusi posterior didefinisikan pada dua variabel, ), sehingga Anda ingin memperkirakan rata-rata posterior: . Sekarang, jika sampler Gibbs tersedia, Anda bisa menjalankannya atau menjalankan algoritma MH untuk mengambil sampel dari posterior.θ = ( μ , ϕE[ θ ∣ data ]
Jika Anda dapat menjalankan sampler Gibbs, maka Anda tahu dalam bentuk tertutup dan Anda tahu rata-rata distribusi ini. Biarkan itu berarti . Perhatikan bahwa adalah fungsi dari dan data.f( ϕ ∣ μ , da t a )ϕ∗ϕ∗μ
Ini juga berarti bahwa Anda dapat mengintegrasikan dari posterior, sehingga posterior marginal dari adalah (ini tidak diketahui sepenuhnya, tetapi dikenal hingga konstan). Sekarang Anda ingin menjalankan rantai Markov sehingga adalah distribusi invarian, dan Anda mendapatkan sampel dari posterior marginal ini. Pertanyaannya adalahϕμf( μ ∣ da t a )f( μ ∣ da t a )
Bagaimana Anda bisa memperkirakan rata-rata posterior hanya menggunakan sampel-sampel ini dari posterior marginal ?ϕμ
Ini dilakukan melalui Rao-Blackwellization.
E[ ϕ ∣ da t a ]= ∫ϕf( μ , ϕ ∣ da t a ) dμdϕ= ∫ϕf( ϕ ∣ μ , da t a ) f( μ ∣ da t a ) dμdϕ= ∫ϕ∗f( μ ∣ da t a ) dμ .
Jadi misalkan kita telah mendapatkan sampel dari posterior marginal . Kemudian
X1,X2, ...XNμ
ϕ^=1N∑i = 1Nϕ∗(Xsaya) ,
disebut penduga Rao-Blackwellized untuk . Hal yang sama dapat dilakukan dengan mensimulasikan dari marginal bersama juga.ϕ
Contoh (Murni untuk demonstrasi).
Misalkan Anda memiliki posterior gabungan yang tidak diketahui untuk dari mana Anda ingin sampel. Data Anda sebagian , dan Anda memiliki persyaratan lengkap berikut
θ = ( μ , ϕ )y
μ ∣ ϕ , y∼ N(ϕ2+ 2 y,y2)
ϕ ∣ μ , y∼ G a m m a ( 2 μ + y, y+ 1 )
Anda menjalankan sampler Gibbs menggunakan persyaratan ini, dan mendapatkan sampel dari posterior bersama . Biarkan sampel ini menjadi . Anda dapat menemukan rata-rata sampel dari , dan itu akan menjadi penduga Monte Carlo biasa untuk rata-rata posterior untuk ..f( μ , ϕ ∣ y)(μ1,ϕ1) , (μ2,ϕ2) , ... , (μN,ϕN)ϕϕ
Atau, perhatikan bahwa dengan properti distribusi Gamma
E[ ϕ | μ , y] =2 μ + yy+ 1=ϕ∗.
Di sini adalah data yang diberikan kepada Anda dan dengan demikian diketahui. Penaksir Rao Blackwellized akan menjadiy
ϕ^=1N∑i = 1N2μsaya+ yy+ 1.
Perhatikan bagaimana estimator untuk rata-rata posterior dari bahkan tidak menggunakan sampel , dan hanya menggunakan sampel . Bagaimanapun, seperti yang Anda lihat, Anda masih menggunakan sampel yang Anda peroleh dari rantai Markov. Ini bukan proses deterministik.ϕϕμ
Sampler Gibbs kemudian dapat digunakan untuk meningkatkan efisiensi (katakanlah) sampel dari posterior marginal, sebut saja . Catatan Demikianlah, kepadatan marginal dari pada beberapa nilai adalah nilai yang diharapkan dari kepadatan bersyarat dari diberikan pada titik .π2(θ2| y)
Ini menarik karena Varian Dekomposisi Lemma mana varian varian bersyarat adalah . Juga, . Secara khusus, Sampler Gibbs akan memberi kita realisasi . Hasilnya adalah lebih baik untuk memperkirakan dengan dibandingkan dengan beberapa estimasi kepadatan kernel konvensional menggunakan untuk titik
Contoh
Misalkan dan adalah bivariat normal dengan rata-rata nol, varian 1 dan korelasi . Yaitu, Jelas, sedikit, , tetapi marilah kita berpura-pura kita tidak tahu ini. Sudah diketahui bahwa distribusi kondisional dari diberikan adalah .X Y ρ
Dengan beberapa realisasi dari estimasi "Rao-Blackwell" dari kepadatan pada maka adalah Sebagai ilustrasi, mari kita bandingkan perkiraan kepadatan kernel dengan pendekatan RBM. ( X, Y) Y y
Kami mengamati bahwa perkiraan RB jauh lebih baik (karena mengeksploitasi informasi bersyarat):
sumber