Turunkan distribusi bersyarat dari distribusi normal multivariat

114

Kami memiliki vektor normal multivariat . Pertimbangkan mempartisi dan menjadi ${\boldsymbol Y} \sim \mathcal{N}(\boldsymbol\mu, \Sigma)$ $\boldsymbol\mu$ ${\boldsymbol Y}$

μ = [\begin{matrix} μ_{1} \\ μ_{2} \end{matrix}]

$\boldsymbol\mu = \begin{bmatrix} \boldsymbol\mu_1 \\ \boldsymbol\mu_2 \end{bmatrix}$

Y = [\begin{matrix} y_{1} \\ y_{2} \end{matrix}]

${\boldsymbol Y}=\begin{bmatrix}{\boldsymbol y}_1 \\ {\boldsymbol y}_2 \end{bmatrix}$

dengan partisi yang sama dari $\Sigma$ ke

[\begin{matrix} Σ_{11} & Σ_{12} \\ Σ_{21} & Σ_{22} \end{matrix}]

$\begin{bmatrix} \Sigma_{11} & \Sigma_{12}\\ \Sigma_{21} & \Sigma_{22} \end{bmatrix}$ Kemudian,

(y_{1} | y_{2} = a)

$({\boldsymbol y}_1|{\boldsymbol y}_2={\boldsymbol a})$ , distribusi kondisional dari partisi pertama yang diberikan kedua, adalah

N (\bar{μ}, \bar{Σ})

$\mathcal{N}(\overline{\boldsymbol\mu},\overline{\Sigma})$ , dengan mean

\bar{μ} = μ_{1} + Σ_{12} {Σ_{22}}^{- 1} (a - μ_{2})

$\overline{\boldsymbol\mu}=\boldsymbol\mu_1+\Sigma_{12}{\Sigma_{22}}^{-1}({\boldsymbol a}-\boldsymbol\mu_2)$ dan matriks kovarians

\bar{Σ} = Σ_{11} - Σ_{12} {Σ_{22}}^{- 1} Σ_{21}

$\overline{\Sigma}=\Sigma_{11}-\Sigma_{12}{\Sigma_{22}}^{-1}\Sigma_{21}$

Sebenarnya hasil ini disediakan di Wikipedia juga, tetapi saya tidak tahu bagaimana $\overline{\boldsymbol\mu}$ dan $\overline{\Sigma}$ diturunkan. Hasil ini sangat penting, karena merupakan formula statistik penting untuk memperoleh filter Kalman . Adakah yang bisa memberi saya langkah derivasi untuk memperoleh $\overline{\boldsymbol\mu}$ dan $\overline{\Sigma}$ ? Terima kasih banyak!

normal-distribution conditional-probability Babi terbang
sumber

Idenya adalah menggunakan definisi kepadatan bersyarat . Anda tahu bahwa gabungan adalah normal bivariat dan marginal adalah normal maka Anda hanya perlu mengganti nilai dan melakukan aljabar yang tidak menyenangkan. Catatan ini mungkin bisa membantu. Ini bukti lengkapnya.

f (y_{1} | y_{2} = a) = \frac{f_{Y_{1}, Y_{2}} (y_{1}, a)}{f_{Y_{2}} (a)}

$f(y_1\vert y_2=a)=\dfrac{f_{Y_1,Y_2}(y_1,a)}{f_{Y_2}(a)}$

f_{Y_{1}, Y_{2}}

$f_{Y_1,Y_2}$

f_{Y_{2}}

$f_{Y_2}$

Tautan kedua Anda menjawab pertanyaan (+1). Mengapa tidak menjawabnya sebagai @Procrastinator?

gui11aume

Saya belum menyadarinya, tapi saya pikir saya secara implisit menggunakan persamaan ini dalam PCA bersyarat. PCA bersyarat membutuhkan transformasi yang secara efektif menghitung matriks kovarians bersyarat yang diberikan beberapa pilihan A.

(I - A^{'} {(A A^{'})}^{- 1} A) Σ

$\left(I-A'\left(AA'\right)^{-1}A\right)\Sigma$

Yohanes

@Procrastinator - pendekatan Anda sebenarnya membutuhkan pengetahuan tentang identitas matriks Woodbury, dan pengetahuan tentang pembalikan matriks blok-bijaksana. Ini menghasilkan aljabar matriks rumit yang tidak perlu.

probabilityislogic

@probabilityislogic Sebenarnya hasilnya terbukti di tautan yang saya berikan. Tapi itu terhormat jika Anda merasa lebih rumit daripada metode lain. Selain itu, saya tidak berusaha memberikan solusi optimal dalam komentar saya . Juga, komentar saya sebelumnya untuk jawaban Makro (yang saya pilih seperti yang Anda lihat).

Jawaban:

111

Anda dapat membuktikannya dengan secara eksplisit menghitung kepadatan bersyarat dengan kekuatan kasar, seperti pada tautan Procrastinator (+1) di komentar. Tetapi, ada juga teorema yang mengatakan bahwa semua distribusi bersyarat dari distribusi normal multivariat adalah normal. Karena itu, yang tersisa hanyalah menghitung vektor rata-rata dan matriks kovarian. Saya ingat kami menurunkan ini dalam kelas deret waktu di perguruan tinggi dengan secara cerdik mendefinisikan variabel ketiga dan menggunakan propertinya untuk memperoleh hasil lebih sederhana daripada solusi brute force dalam tautan (selama Anda merasa nyaman dengan aljabar matriks). Saya pergi dari memori tetapi itu adalah sesuatu seperti ini:

Biarkan menjadi partisi pertama dan yang kedua. Sekarang tentukan mana . Sekarang kita bisa menulis ${\bf x}_{1}$ ${\bf x}_2$ ${\bf z} = {\bf x}_1 + {\bf A} {\bf x}_2$ ${\bf A} = -\Sigma_{12} \Sigma^{-1}_{22}$

\begin{aligned} c o v (z, x_{2}) & = c o v (x_{1}, x_{2}) + c o v (A x_{2}, x_{2}) \\ = Σ_{12} + A v a r (x_{2}) \\ = Σ_{12} - Σ_{12} Σ_{22}^{- 1} Σ_{22} \\ = 0 \end{aligned}

$\begin{align*} {\rm cov}({\bf z}, {\bf x}_2) &= {\rm cov}( {\bf x}_{1}, {\bf x}_2 ) + {\rm cov}({\bf A}{\bf x}_2, {\bf x}_2) \\ &= \Sigma_{12} + {\bf A} {\rm var}({\bf x}_2) \\ &= \Sigma_{12} - \Sigma_{12} \Sigma^{-1}_{22} \Sigma_{22} \\ &= 0 \end{align*}$

Karena itu dan tidak berkorelasi dan, karena keduanya secara normal normal, keduanya independen . Sekarang, jelas , oleh karena itu ia mengikuti bahwa ${\bf z}$ ${\bf x}_2$ $E({\bf z}) = {\boldsymbol \mu}_1 + {\bf A} {\boldsymbol \mu}_2$

\begin{aligned} E (x_{1} | x_{2}) & = E (z - A x_{2} | x_{2}) \\ = E (z | x_{2}) - E (A x_{2} | x_{2}) \\ = E (z) - A x_{2} \\ = μ_{1} + A (μ_{2} - x_{2}) \\ = μ_{1} + Σ_{12} Σ_{22}^{- 1} (x_{2} - μ_{2}) \end{aligned}

$\begin{align*} E({\bf x}_1 | {\bf x}_2) &= E( {\bf z} - {\bf A} {\bf x}_2 | {\bf x}_2) \\ & = E({\bf z}|{\bf x}_2) - E({\bf A}{\bf x}_2|{\bf x}_2) \\ & = E({\bf z}) - {\bf A}{\bf x}_2 \\ & = {\boldsymbol \mu}_1 + {\bf A} ({\boldsymbol \mu}_2 - {\bf x}_2) \\ & = {\boldsymbol \mu}_1 + \Sigma_{12} \Sigma^{-1}_{22} ({\bf x}_2- {\boldsymbol \mu}_2) \end{align*}$

yang membuktikan bagian pertama. Untuk matriks kovarians, perhatikan itu

\begin{aligned} v a r (x_{1} | x_{2}) & = v a r (z - A x_{2} | x_{2}) \\ = v a r (z | x_{2}) + v a r (A x_{2} | x_{2}) - A c o v (z, - x_{2}) - c o v (z, - x_{2}) A^{'} \\ = v a r (z | x_{2}) \\ = v a r (z) \end{aligned}

$\begin{align*} {\rm var}({\bf x}_1|{\bf x}_2) &= {\rm var}({\bf z} - {\bf A} {\bf x}_2 | {\bf x}_2) \\ &= {\rm var}({\bf z}|{\bf x}_2) + {\rm var}({\bf A} {\bf x}_2 | {\bf x}_2) - {\bf A}{\rm cov}({\bf z}, -{\bf x}_2) - {\rm cov}({\bf z}, -{\bf x}_2) {\bf A}' \\ &= {\rm var}({\bf z}|{\bf x}_2) \\ &= {\rm var}({\bf z}) \end{align*}$

Sekarang kita hampir selesai:

\begin{aligned} v a r (x_{1} | x_{2}) = v a r (z) & = v a r (x_{1} + A x_{2}) \\ = v a r (x_{1}) + A v a r (x_{2}) A^{'} + A c o v (x_{1}, x_{2}) + c o v (x_{2}, x_{1}) A^{'} \\ = Σ_{11} + Σ_{12} Σ_{22}^{- 1} Σ_{22} Σ_{22}^{- 1} Σ_{21} - 2 Σ_{12} Σ_{22}^{- 1} Σ_{21} \\ = Σ_{11} + Σ_{12} Σ_{22}^{- 1} Σ_{21} - 2 Σ_{12} Σ_{22}^{- 1} Σ_{21} \\ = Σ_{11} - Σ_{12} Σ_{22}^{- 1} Σ_{21} \end{aligned}

$\begin{align*} {\rm var}({\bf x}_1|{\bf x}_2) = {\rm var}( {\bf z} ) &= {\rm var}( {\bf x}_1 + {\bf A} {\bf x}_2 ) \\ &= {\rm var}( {\bf x}_1 ) + {\bf A} {\rm var}( {\bf x}_2 ) {\bf A}' + {\bf A} {\rm cov}({\bf x}_1,{\bf x}_2) + {\rm cov}({\bf x}_2,{\bf x}_1) {\bf A}' \\ &= \Sigma_{11} +\Sigma_{12} \Sigma^{-1}_{22} \Sigma_{22}\Sigma^{-1}_{22}\Sigma_{21} - 2 \Sigma_{12} \Sigma_{22}^{-1} \Sigma_{21} \\ &= \Sigma_{11} +\Sigma_{12} \Sigma^{-1}_{22}\Sigma_{21} - 2 \Sigma_{12} \Sigma_{22}^{-1} \Sigma_{21} \\ &= \Sigma_{11} -\Sigma_{12} \Sigma^{-1}_{22}\Sigma_{21} \end{align*}$

yang membuktikan bagian kedua.

Catatan: Bagi mereka yang tidak terlalu mengenal aljabar matriks yang digunakan di sini, ini adalah sumber yang bagus .

Sunting: Satu properti yang digunakan di sini ini tidak ada dalam buku masak matriks (tangkapan bagus @FlyingPig) adalah properti 6 di halaman wikipedia tentang matriks kovarians: yaitu untuk dua vektor acak , Untuk skalar, tentu saja, tetapi untuk vektor mereka berbeda sejauh matriks disusun secara berbeda. $\bf x, y$

v a r (x + y) = v a r (x) + v a r (y) + c o v (x, y) + c o v (y, x)

${\rm var}({\bf x}+{\bf y}) = {\rm var}({\bf x})+{\rm var}({\bf y}) + {\rm cov}({\bf x},{\bf y}) + {\rm cov}({\bf y},{\bf x})$

c o v (X, Y) = c o v (Y, X)

${\rm cov}(X,Y)={\rm cov}(Y,X)$

Makro
sumber

Terima kasih untuk metode brilian ini! Ada satu aljabar matriks yang sepertinya tidak saya kenal, di mana saya bisa menemukan rumus untuk membuka ? Saya belum menemukannya di tautan yang Anda kirim.

v a r (x_{1} + A x_{2})

$var(x_1+Ax_2)$

Babi terbang

@Flyingpig, sama-sama. Saya percaya ini adalah hasil dari persamaan , dikombinasikan dengan properti tambahan dari varian jumlah vektor acak yang tidak ditulis dalam Matrix Cookbook - Saya telah menambahkan fakta ini ke jawaban saya - terima kasih telah menangkap bahwa!

(291), (292)

$(291),(292)$

Makro

Ini adalah jawaban yang sangat bagus (+1), tetapi dapat ditingkatkan dalam hal pemesanan pendekatan. Kita mulai dengan mengatakan kita menginginkan kombinasi linear dari seluruh vektor yang independen / tidak berkorelasi dengan . Ini karena kita dapat menggunakan fakta bahwa yang berarti dan . Ini pada gilirannya mengarah ke ekspresi untuk dan . Ini berarti kita harus mengambil . Sekarang kita membutuhkan . Jika tidak dapat dibalik maka kita miliki

z = C x = C_{1} x_{1} + C_{2} x_{2}

$z=Cx=C_1x_1+C_2x_2$

x_{2}

$x_2$

p (z | x_{2}) = p (z)

$p(z|x_2)=p(z)$

v a r (z | x_{2}) = v a r (z)

$var(z|x_2)=var(z)$

E (z | x_{2}) = E (z)

$E(z|x_2)=E(z)$

v a r (C_{1} x_{1} | x_{2})

$var(C_1x_1|x_2)$

E (C_{1} x_{1} | x_{2})

$E(C_1x_1|x_2)$

C_{1} = I

$C_1=I$

c o v (z, x_{2}) = Σ_{12} + C_{2} Σ_{22} = 0

$cov(z,x_2)=\Sigma_{12}+C_2\Sigma_{22}=0$

Σ_{22}

$\Sigma_{22}$

C_{2} = - Σ_{12} Σ_{22}^{- 1}

$C_2=-\Sigma_{12}\Sigma_{22}^{-1}$ .

probabilityislogic

@jakeoung - ini tidak membuktikan bahwa , itu menyetelnya ke nilai ini, sehingga kami mendapatkan ekspresi yang berisi variabel yang ingin kami ketahui.

C_{1} = I

$C_1=I$

probabilityislogic

@ Jayake Saya juga tidak mengerti pernyataan itu. Saya mengerti dengan cara ini: Jika , maka . Jadi nilai entah bagaimana merupakan skala arbitrer. Jadi kami menetapkan untuk kesederhanaan.

c o v (z, x_{2}) = 0

$cov(z, x_2)=0$

c o v (C_{1}^{- 1} z, x_{2}) = C_{1}^{- 1} c o v (z, x_{2}) = 0

$cov(C_1^{-1} z, x_2) = C_1^{-1} cov( z, x_2)=0$

C_{1}

$C_1$

C_{1} = I

$C_1=I$

Ken T

Jawaban Macro sangat bagus, tetapi di sini ada cara yang bahkan lebih sederhana yang tidak mengharuskan Anda untuk menggunakan teorema luar yang menyatakan distribusi bersyarat. Ini melibatkan penulisan jarak Mahanalobis dalam bentuk yang memisahkan variabel argumen untuk pernyataan pengkondisian, dan kemudian memfaktorkan kepadatan normal sesuai.

Menulis ulang jarak Mahanalobis untuk vektor bersyarat: Derivasi ini menggunakan rumus inversi matriks yang menggunakan komplemen Schur . Kami pertama-tama menggunakan rumus inversi blockwise untuk menulis matriks invers-variance sebagai: $\boldsymbol{\Sigma}_\text{S} = \boldsymbol{\Sigma}_{11} - \boldsymbol{\Sigma}_{12} \boldsymbol{\Sigma}_{22}^{-1} \boldsymbol{\Sigma}_{21}$

\begin{aligned} Σ^{- 1} = {[\begin{matrix} Σ_{11} & Σ_{12} \\ Σ_{21} & Σ_{22} \end{matrix}]}^{- 1} = [\begin{matrix} Σ_{11}^{*} & Σ_{12}^{*} \\ Σ_{21}^{*} & Σ_{22}^{*} \end{matrix}], \end{aligned}

$\begin{equation} \begin{aligned} \boldsymbol{\Sigma}^{-1} = \begin{bmatrix} \boldsymbol{\Sigma}_{11} & \boldsymbol{\Sigma}_{12} \\ \boldsymbol{\Sigma}_{21} & \boldsymbol{\Sigma}_{22} \\ \end{bmatrix}^{-1} = \begin{bmatrix} \boldsymbol{\Sigma}_{11}^* & \boldsymbol{\Sigma}_{12}^* \\ \boldsymbol{\Sigma}_{21}^* & \boldsymbol{\Sigma}_{22}^* \\ \end{bmatrix}, \end{aligned} \end{equation}$

dimana:

\begin{aligned} \begin{matrix} Σ_{11}^{*} = Σ_{S}^{- 1} & Σ_{12}^{*} = - Σ_{S}^{- 1} Σ_{12} Σ_{22}^{- 1}, \\ Σ_{21}^{*} = - Σ_{22}^{- 1} Σ_{12} Σ_{S}^{- 1} & Σ_{22}^{*} = Σ_{22}^{- 1} Σ_{12} Σ_{S}^{- 1} Σ_{12} Σ_{22}^{- 1} . \end{matrix} \end{aligned}

$\begin{equation} \begin{aligned} \begin{matrix} \boldsymbol{\Sigma}_{11}^* = \boldsymbol{\Sigma}_\text{S}^{-1} \text{ } \quad \quad \quad \quad & & & & & \boldsymbol{\Sigma}_{12}^* = -\boldsymbol{\Sigma}_\text{S}^{-1} \boldsymbol{\Sigma}_{12} \boldsymbol{\Sigma}_{22}^{-1}, \quad \quad \quad \\[6pt] \boldsymbol{\Sigma}_{21}^* = - \boldsymbol{\Sigma}_{22}^{-1} \boldsymbol{\Sigma}_{12} \boldsymbol{\Sigma}_\text{S}^{-1} & & & & & \boldsymbol{\Sigma}_{22}^* = \boldsymbol{\Sigma}_{22}^{-1} \boldsymbol{\Sigma}_{12} \boldsymbol{\Sigma}_\text{S}^{-1} \boldsymbol{\Sigma}_{12} \boldsymbol{\Sigma}_{22}^{-1}. \text{ } \\[6pt] \end{matrix} \end{aligned} \end{equation}$

Menggunakan rumus ini sekarang kita dapat menulis jarak Mahanalobis sebagai:

\begin{aligned} (y - μ)^{T} Σ^{- 1} (y - μ) & = {[\begin{matrix} y_{1} - μ_{1} \\ y_{2} - μ_{2} \end{matrix}]}^{T} [\begin{matrix} Σ_{11}^{*} & Σ_{12}^{*} \\ Σ_{21}^{*} & Σ_{22}^{*} \end{matrix}] [\begin{matrix} y_{1} - μ_{1} \\ y_{2} - μ_{2} \end{matrix}] \\ = (y_{1} - μ_{1})^{T} Σ_{11}^{*} (y_{1} - μ_{1}) + (y_{1} - μ_{1})^{T} Σ_{12}^{*} (y_{2} - μ_{2}) \\ + (y_{2} - μ_{2})^{T} Σ_{21}^{*} (y_{1} - μ_{1}) + (y_{2} - μ_{2})^{T} Σ_{22}^{*} (y_{2} - μ_{2}) \\ = (y_{1} - (μ_{1} + Σ_{12} Σ_{22}^{- 1} (y_{2} - μ_{2})))^{T} Σ_{S}^{- 1} (y_{1} - (μ_{1} + Σ_{12} Σ_{22}^{- 1} (y_{2} - μ_{2}))) \\ = (y_{1} - μ_{*})^{T} Σ_{*}^{- 1} (y_{1} - μ_{*}), \end{aligned}

$\begin{equation} \begin{aligned} (\boldsymbol{y} - \boldsymbol{\mu})^\text{T} \boldsymbol{\Sigma}^{-1} (\boldsymbol{y} - \boldsymbol{\mu}) &= \begin{bmatrix} \boldsymbol{y}_1 - \boldsymbol{\mu}_1 \\ \boldsymbol{y}_2 - \boldsymbol{\mu}_2 \end{bmatrix}^\text{T} \begin{bmatrix} \boldsymbol{\Sigma}_{11}^* & \boldsymbol{\Sigma}_{12}^* \\ \boldsymbol{\Sigma}_{21}^* & \boldsymbol{\Sigma}_{22}^* \\ \end{bmatrix} \begin{bmatrix} \boldsymbol{y}_1 - \boldsymbol{\mu}_1 \\ \boldsymbol{y}_2 - \boldsymbol{\mu}_2 \end{bmatrix} \\[6pt] &= \quad (\boldsymbol{y}_1 - \boldsymbol{\mu}_1)^\text{T} \boldsymbol{\Sigma}_{11}^* (\boldsymbol{y}_1 - \boldsymbol{\mu}_1) + (\boldsymbol{y}_1 - \boldsymbol{\mu}_1)^\text{T} \boldsymbol{\Sigma}_{12}^* (\boldsymbol{y}_2 - \boldsymbol{\mu}_2) \\[6pt] &\quad + (\boldsymbol{y}_2 - \boldsymbol{\mu}_2)^\text{T} \boldsymbol{\Sigma}_{21}^* (\boldsymbol{y}_1 - \boldsymbol{\mu}_1) + (\boldsymbol{y}_2 - \boldsymbol{\mu}_2)^\text{T} \boldsymbol{\Sigma}_{22}^* (\boldsymbol{y}_2 - \boldsymbol{\mu}_2) \\[6pt] &= (\boldsymbol{y}_1 - (\boldsymbol{\mu}_1 + \boldsymbol{\Sigma}_{12} \boldsymbol{\Sigma}_{22}^{-1} (\boldsymbol{y}_2 - \boldsymbol{\mu}_2)))^\text{T} \boldsymbol{\Sigma}_\text{S}^{-1} (\boldsymbol{y}_1 - (\boldsymbol{\mu}_1 + \boldsymbol{\Sigma}_{12} \boldsymbol{\Sigma}_{22}^{-1} (\boldsymbol{y}_2 - \boldsymbol{\mu}_2))) \\[6pt] &= (\boldsymbol{y}_1 - \boldsymbol{\mu}_*)^\text{T} \boldsymbol{\Sigma}_*^{-1} (\boldsymbol{y}_1 - \boldsymbol{\mu}_*), \\[6pt] \end{aligned} \end{equation}$

dimana:

\begin{aligned} μ_{*} & \equiv μ_{1} + Σ_{12} Σ_{22}^{- 1} (y_{2} - μ_{2}), \\ Σ_{*} & \equiv Σ_{11} - Σ_{12} Σ_{22}^{- 1} Σ_{21} . \end{aligned}

$\begin{equation} \begin{aligned} \boldsymbol{\mu}_* &\equiv \boldsymbol{\mu}_1 + \boldsymbol{\Sigma}_{12} \boldsymbol{\Sigma}_{22}^{-1} (\boldsymbol{y}_2 - \boldsymbol{\mu}_2), \\[8pt] \boldsymbol{\Sigma}_* &\equiv \boldsymbol{\Sigma}_{11} - \boldsymbol{\Sigma}_{12} \boldsymbol{\Sigma}_{22}^{-1} \boldsymbol{\Sigma}_{21}. \\[6pt] \end{aligned} \end{equation}$

Perhatikan bahwa hasil ini adalah hasil umum yang tidak menganggap normalitas vektor acak. Ini memberikan cara yang berguna untuk membingkai ulang jarak Mahanalobis sehingga merupakan bentuk kuadrat sehubungan dengan hanya satu vektor dalam dekomposisi (dengan yang lain diserap ke dalam vektor rata-rata dan matriks varian).

Turunkan distribusi bersyarat: Sekarang kita memiliki bentuk di atas untuk jarak Mahanalobis, sisanya mudah. Kita punya:

\begin{aligned} p (y_{1} | y_{2}, μ, Σ) & \overset{y_{1}}{\propto} p (y_{1}, y_{2} | μ, Σ) \\ = N (y | μ, Σ) \\ \overset{y_{1}}{\propto} \exp (- \frac{1}{2} (y - μ)^{T} Σ^{- 1} (y - μ)) \\ = \exp (- \frac{1}{2} (y_{1} - μ_{*})^{T} Σ_{*}^{- 1} (y_{1} - μ_{*})) \\ \overset{y_{1}}{\propto} N (y_{1} | μ_{*}, Σ_{*}) . \end{aligned}

$\begin{equation} \begin{aligned} p(\boldsymbol{y}_1 | \boldsymbol{y}_2, \boldsymbol{\mu}, \boldsymbol{\Sigma}) &\overset{\boldsymbol{y}_1}{\propto} p(\boldsymbol{y}_1 , \boldsymbol{y}_2 | \boldsymbol{\mu}, \boldsymbol{\Sigma}) \\[12pt] &= \text{N}(\boldsymbol{y} | \boldsymbol{\mu}, \boldsymbol{\Sigma}) \\[10pt] &\overset{\boldsymbol{y}_1}{\propto} \exp \Big( - \frac{1}{2} (\boldsymbol{y} - \boldsymbol{\mu})^\text{T} \boldsymbol{\Sigma}^{-1} (\boldsymbol{y} - \boldsymbol{\mu}) \Big) \\[6pt] &= \exp \Big( - \frac{1}{2} (\boldsymbol{y}_1 - \boldsymbol{\mu}_*)^\text{T} \boldsymbol{\Sigma}_*^{-1} (\boldsymbol{y}_1 - \boldsymbol{\mu}_*) \Big) \\[6pt] &\overset{\boldsymbol{y}_1}{\propto}\text{N}(\boldsymbol{y}_1 | \boldsymbol{\mu}_*, \boldsymbol{\Sigma}_*). \\[6pt] \end{aligned} \end{equation}$

Ini menetapkan bahwa distribusi kondisional juga multivariat normal, dengan vektor mean kondisional yang ditentukan dan matriks varians kondisional.

Ben
sumber