Memperkirakan distribusi posterior kovarian gaussian multivariat

15

Saya perlu "mempelajari" distribusi gaussian bivariat dengan beberapa sampel, tetapi hipotesis yang baik pada distribusi sebelumnya, jadi saya ingin menggunakan pendekatan bayesian.

Saya mendefinisikan sebelumnya:

P(μ)N(μ0,Σ0)
μ0=[00]   Σ0=[160027]

Dan distribusi saya diberi hipotesis μ = [ 0 0 ] Σ = [ 18 0 0 18 ]

P(x|μ,Σ)N(μ,Σ)
μ=[00]   Σ=[180018]

Sekarang saya tahu terima kasih di sini bahwa untuk memperkirakan rata-rata yang diberikan data

P(μ|x1,,xn)N(μ^n,Σ^n)

Saya dapat menghitung:

μ^n=Σ0(Σ0+1nΣ)1(1ni=1nxi)+1nΣ(Σ0+1nΣ)1μ0

Σ^n=1nΣ0(Σ0+1nΣ)1Σ

Sekarang muncul pertanyaan, mungkin saya salah, tetapi tampaknya bagi saya bahwa hanyalah matriks kovarians untuk parameter estimasi μ n , dan bukan kovarian estimasi data saya. Apa yang saya ingin hitung jugaΣnμn

P(Σn1|x1,,xn)

agar distribusi yang ditentukan sepenuhnya dipelajari dari data saya.

Apakah ini mungkin? Apakah sudah diselesaikan dengan menghitung dan itu hanya dinyatakan dengan cara yang salah rumus di atas (atau saya hanya salah mengartikannya)? Referensi akan dihargai. Terima kasih banyak.Σn

EDIT

Dari komentar, tampak bahwa pendekatan saya "salah", dalam arti bahwa saya mengasumsikan kovarians konstan, yang didefinisikan oleh . Apa yang saya butuhkan adalah meletakkan sebelumnya juga di atasnya, P ( Σ ) , tetapi saya tidak tahu distribusi apa yang harus saya gunakan, dan kemudian bagaimana prosedur untuk memperbaruinya.ΣP(Σ)

unziberla
sumber
Σ=[180018]
P(Σ)F(μΣ,ΣΣ)
Kemudian ubah pertanyaan :-)
Corone

Jawaban:

11

Anda dapat melakukan pembaruan Bayesian untuk struktur kovarian dengan semangat yang sama dengan Anda memperbarui nilai tengah. Konjugat sebelum matriks kovarian multivariat-normal adalah distribusi Inverse-Wishart, jadi masuk akal untuk memulainya,

P(Σ)W1(Ψ,ν)

XnΣX=1n(Xμ)(Xμ)

Ini kemudian dapat digunakan untuk memperbarui estimasi Anda dari matriks kovarians

P(Σ|X)W1(nΣX+Ψ,n+ν)

Anda dapat memilih untuk menggunakan mean ini sebagai estimasi poin Anda untuk kovarian (Posterior Mean Estimator)

E[Σ|X]=nΣX+Ψν+np1

atau Anda dapat memilih untuk menggunakan mode (Penaksir Posteriori Maksimum)

Mode[Σ|X]=nΣX+Ψν+n+hal+1

Corone
sumber
Terima kasih banyak. Sekarang saya berasumsi sesuatu akan berubah dalam proses estimasi saya. Sebagai langkah pertama, saya harus memperkirakan kovariansΣ^ dengan prosedur Anda, maka distribusi saya diberikan hipotesis yang diperkirakan akan P(X|μ,Σ^) dan sejak itu Σ^ diperkirakan dan memiliki distribusinya sendiri. Saya cukup yakin ini entah bagaimana akan mengubah rumus saya sebelumnya untuk menghitung μ^n(seperti yang terjadi pada MLE gaussian saat menggunakan varians sampel).
unziberla
Pendekatan yang Anda gambarkan akan digunakan Σ^=E[Σ|x1...xn]sehingga saya memiliki nilai aktual untuk kovarians, seolah-olah saya tahu sebelumnya. Dalam pendekatan frequentist, ini kedengarannya salah, tapi mungkin ada sesuatu yang saya lewatkan dari kenyataan bahwa saya menganggap yang sebelumnya diketahui dan ini membuat prosedurnya benar?
unziberla
7

Ok, saya menemukan solusi nyata untuk masalah saya. Saya mempostingnya meskipun jawaban yang benar untuk pertanyaan (salah tempat) saya adalah yang dipilih.

Pada dasarnya, pertanyaan saya menjelaskan bagaimana cara memperkirakan rata-rata mengetahui kovarians, dan jawaban bagaimana memperkirakan kovarians mengetahui rata-rata. Tapi masalah saya yang sebenarnya adalah estimasi dengan kedua parameter tidak diketahui.

Saya menemukan jawabannya di Wikipedia dengan derivasi yang dijelaskan di sini . Sebelum terkonjugasi normal multivariat adalah Normal-inverse-Wishart, yang pada dasarnya adalah distribusi atas multivarian Normals.

Parameter sebelumnya yang perlu ditentukan adalah μ0 untuk menentukan rata-rata, Ψ untuk menentukan kovarians, dan dua nilai skalar κ0 dan ν0 yang akan saya katakan mendefinisikan seberapa percaya diri kita pada estimasi dua parameter pertama masing-masing.

The updated distribution after observing n samples of a p-variate Normal has the form

P(μ,Σ|X)NIW(κ0μ0+nx¯κ0+n,κ0+n,ν0+n,Ψ+C+κ0nκ0+n(x¯μ0)(x¯μ0)T)

where

x¯=1ni=0nxi

C=i=1n(xix¯)(xix¯)T

so my desired estimated parameters are

E(μ|X)=κ0μ0+nx¯κ0+n
E(Σ|X)=Ψ+C+κ0nκ0+n(x¯μ0)(x¯μ0)Tν0+np1
unziberla
sumber