Memperoleh Estimator Kemungkinan Maksimum
Asumsikan bahwa kita memiliki vektor acak, masing-masing ukuran p : X ( 1 ) , X ( 2 ) , . . . , X ( m ) di mana setiap vektor acak dapat diartikan sebagai pengamatan (titik data) di seluruh variabel p . Jika setiap X ( i ) iid sebagai vektor Gaussian multivarian:mpX(1),X(2),...,X(m)pX(i)
X(i)∼Np(μ,Σ)
Di mana parameter tidak diketahui. Untuk mendapatkan estimasi mereka, kita dapat menggunakan metode kemungkinan maksimum dan memaksimalkan fungsi kemungkinan log.μ,Σ
Perhatikan bahwa dengan kemerdekaan vektor acak, kepadatan gabungan dari data adalah produk dari kepadatan individu, yaitu ∏ m i = 1 f X ( i ) ( x ( i ) ; μ , Σ ) . Mengambil logaritma memberikan fungsi log-likelihood{X(i),i=1,2,...,m}∏mi=1fX(i)(x(i);μ,Σ)
l(μ,Σ|x(i))=log∏i=1mfX(i)(x(i)|μ,Σ)=log ∏i=1m1(2π)p/2|Σ|1/2exp(−12(x(i)−μ)TΣ−1(x(i)−μ))=∑i=1m(−p2log(2π)−12log|Σ|−12(x(i)−μ)TΣ−1(x(i)−μ))
l(μ,Σ;)=−mp2log(2π)−m2log|Σ|−12∑i=1m(x(i)−μ)TΣ−1(x(i)−μ)
berasal μμ^
Untuk mengambil turunan sehubungan dengan dan menyamakan dengan nol, kami akan menggunakan identitas kalkulus matriks berikut:μ
jikaw
tidak bergantung padaAdanAadalah simetris.∂wTAw∂w=2AwwAA
∂∂μl(μ,Σ|x(i))0μ^=∑i=1mΣ−1(μ−x(i))=0Since Σ is positive definite=mμ−∑i=1mx(i)=1m∑i=1mx(i)=x¯
Yang sering disebut sampel mean vector.
berasal ΣΣ^
Turunkan MLE untuk matriks kovarians membutuhkan lebih banyak pekerjaan dan penggunaan aljabar linear dan properti kalkulus berikut:
- Jejak tidak berubah di bawah permutasi siklik dari produk matriks: tr[ACB]=tr[CAB]=tr[BCA]
- Karena adalah skalar, kita dapat mengambil jejaknya dan mendapatkan nilai yang sama: x t A x = t r [ x T A x ] = t r [ x t x A ]xTAxxtAx=tr[xTAx]=tr[xtxA]
- ∂∂Atr[AB]=BT
- ∂∂Alog|A|=A−T
Menggabungkan sifat-sifat ini memungkinkan kita untuk menghitung
∂∂AxtAx=∂∂Atr[xTxA]=[xxt]T=xTTxT=xxT
Yang merupakan produk luar dari vektor dengan dirinya sendiri.x
Kita sekarang dapat menulis kembali fungsi log-likelihood dan menghitung turunan wrt (catatan C konstan)Σ−1C
l(μ,Σ|x(i))∂∂Σ−1l(μ,Σ|x(i))=C−m2log|Σ|−12∑i=1m(x(i)−μ)TΣ−1(x(i)−μ)=C+m2log|Σ−1|−12∑i=1mtr[(x(i)−μ)(x(i)−μ)TΣ−1]=m2Σ−12∑i=1m(x(i)−μ)(x(i)−μ)T Since ΣT=Σ
Menyamakan dengan nol dan menyelesaikan untuk Σ
0Σ^=mΣ−∑i=1m(x(i)−μ)(x(i)−μ)T=1m∑i=1m(x(i)−μ^)(x(i)−μ^)T
Sumber
sumber