Posterior normal multivarian

18

Ini adalah pertanyaan yang sangat sederhana tetapi saya tidak dapat menemukan derivasi di mana pun di internet atau dalam buku. Saya ingin melihat derivasi bagaimana seseorang Bayesian memperbarui distribusi normal multivariat. Sebagai contoh: bayangkan itu

P(x|μ,Σ)=N(μ,Σ)P(μ)=N(μ0,Σ0).

Setelah mengamati serangkaian x1...xn , saya ingin menghitung P(μ|x1...xn) . Saya tahu bahwa jawabannya adalah P(μ|x1...xn)=N(μn,Σn) mana

μn=Σ0(Σ0+1nΣ)1(1ni=1nxi)+1nΣ(Σ0+1nΣ)1μ0Σn=Σ0(Σ0+1nΣ)11nΣ

Saya mencari derivasi dari hasil ini dengan semua aljabar matriks menengah.

Bantuan apa pun sangat kami hargai.

Alex
sumber
2
Itu juga dipecahkan dalam buku kami Bayesian Core , Chap. 3, Bagian 3.2, halaman 54-57 dengan apa yang kami pikir adalah aljabar matriks terperinci!
Xi'an
1
OP mengatakan itu bukan masalah pekerjaan rumah dan bahkan menjelaskan mengapa dia menanyakannya dan bagaimana dia ingin menggunakan jawabannya. Mengapa tidak mempostingnya untuk orang lain? Saya mengerti mengapa kami tidak ingin memberikan layanan penyelesaian masalah pekerjaan rumah tetapi ini agak terlalu jauh.
Michael R. Chernick
3
@Alex: Maaf, tautan salah, maksud saya Bayesian Core . Perhatikan bahwa kami juga memposting solusi untuk semua masalah di arXiv . Jadi memposting solusi lengkap di sini tidak ada salahnya!
Xi'an
1
Saya telah menghapus bagian dari komentar yang berjumlah pertukaran pribadi antara individu dengan pengaturan untuk berbagi jawaban pribadi untuk pertanyaan. Hal semacam itu menyalahgunakan situs ini, yang adalah semua tentang publik pertanyaan dan publik jawaban.
whuber
1
Sama seperti FYI, derivasi dalam Klasifikasi Pola oleh Duda, Hart dan Bangau. Namun, saya kesulitan mengikuti beberapa langkah mereka yang hanya penting bagi saya. Jika ini hanya pekerjaan rumah, cukup tuliskan apa yang mereka miliki.
Alex

Jawaban:

6

Dengan distribusi pada vektor acak kami:

xi|μN(μ,Σ)

μN(μ0,Σ0)

Menurut aturan Bayes, distribusi posterior terlihat seperti:

p(μ|{xi})p(μ)i=1Np(xi|μ)

Begitu:

lnp(μ|{xi})=12i=1N(xiμ)Σ1(xiμ)12(μμ0)Σ01(μμ0)+const

=12NμΣ1μ+i=1NμΣ1xi12μΣ01μ+μΣ01μ0+const

=12μ(NΣ1+Σ01)μ+μ(Σ01μ0+Σ1i=1Nxi)+const

=12(μ(NΣ1+Σ01)1(Σ01μ0+Σ1i=1Nxi))(NΣ1+Σ01)(μ(NΣ1+Σ01)1(Σ01μ0+Σ1i=1Nxi))+const

Yang merupakan kepadatan log seorang Gaussian:

μ|{xi}N((NΣ1+Σ01)1(Σ01μ0+Σ1i=1Nxi),(NΣ1+Σ01)1)

Menggunakan identitas Woodbury pada ekspresi kami untuk matriks kovarians:

(NΣ1+Σ01)1=Σ(1NΣ+Σ0)11NΣ0

Yang menyediakan matriks kovarians dalam bentuk OP yang diinginkan. Menggunakan ungkapan ini (dan simetrinya) lebih jauh dalam ungkapan untuk mean yang kita miliki:

Σ(1NΣ+Σ0)11NΣ0Σ01μ0+1NΣ0(1NΣ+Σ0)1ΣΣ1i=1Nxi

=Σ(1NΣ+Σ0)11Nμ0+Σ0(1NΣ+Σ0)1i=1N(1Nxi)

Yang merupakan bentuk yang dibutuhkan oleh OP untuk mean.

dugaan
sumber