Katakanlah saya memiliki kepadatan multivarian normal . Saya ingin mendapatkan turunan kedua (parsial) wrt . Tidak yakin bagaimana cara mengambil turunan dari sebuah matriks.
Wiki mengatakan ambil elemen turunan dengan elemen di dalam matriks.
Saya bekerja dengan aproksimasi Laplace Mode adalah .Θ = μ
Saya diberi bagaimana ini bisa terjadi?
Apa yang telah saya lakukan:
Jadi, saya mengambil turunan wrt ke , pertama, ada transpos, kedua, itu adalah matriks. Jadi saya terjebak.
Catatan: Jika profesor saya menemukan ini, saya merujuk pada kuliah.
self-study
normal-distribution
matrix
pengguna1061210
sumber
sumber
Jawaban:
Dalam bab 2 dari Matrix Cookbook ada ulasan bagus tentang hal-hal kalkulus matriks yang memberikan banyak identitas berguna yang membantu dengan masalah yang akan dihadapi seseorang dalam melakukan probabilitas dan statistik, termasuk aturan untuk membantu membedakan kemungkinan multisariat Gaussian Gaussian.
Jika Anda memiliki vektor acak yang normal multivariat dengan vektor rata-rata μ dan matriks kovarian Σ , maka gunakan persamaan (86) dalam buku masak matriks untuk menemukan bahwa gradien log kemungkinan log L berkenaan dengan μ adalahy μ Σ L μ
Saya akan menyerahkan kepada Anda untuk membedakan ini lagi dan menemukan jawabannya adalah .−Σ−1
Sebagai "kredit ekstra", gunakan persamaan (57) dan (61) untuk menemukan bahwa gradien sehubungan dengan adalahΣ
Saya telah meninggalkan banyak langkah, tetapi saya membuat derivasi ini hanya dengan menggunakan identitas yang ditemukan dalam buku masak matriks, jadi saya akan menyerahkan kepada Anda untuk mengisi kekosongan.
Saya telah menggunakan persamaan skor ini untuk estimasi kemungkinan maksimum, jadi saya tahu mereka benar :)
sumber
Anda perlu memastikan bahwa Anda benar mengurus elemen diulang dalam , jika tidak, anda derivatif sedang akan salah. Sebagai contoh, (141) Matrix Cookbook memberikan simetris met turunan berikutΣ Σ
Dan (14) Diferensiasi fungsi matriks kovarian memberikan
where∘ denotes the Hadmard product and for convenience we have defined x:=y−μ .
Note in particular this is not the same as when symmetricity ofΣ is not imposed. As a result we have that
whereD denotes the dimension of x , y and μ and the derivative of Dlog|2π| is 0
This ensures thei,jth element of ∂L∂Σ corresponds to ∂L∂Σij .
sumber
I tried to computationally verify @Macro's answer but found what appears to be a minor error in the covariance solution. He obtained
sumber