Misalkan saya memiliki model berikut
di mana , adalah vektor dari variabel penjelas, adalah parameter fungsi non-linear dan , di mana alami adalah matriks.
Tujuannya adalah untuk memperkirakan dan . Pilihan yang jelas adalah metode kemungkinan maksimum. Log-kemungkinan untuk model ini (dengan asumsi kita memiliki sampel ) terlihat seperti
Sekarang ini tampak sederhana, kemungkinan log ditentukan, dimasukkan ke dalam data, dan menggunakan beberapa algoritma untuk optimasi non-linear. Masalahnya adalah bagaimana memastikan bahwa pasti positif. Menggunakan misalnya dalam R (atau algoritma optimasi non-linear lainnya) tidak akan menjamin saya bahwa pasti positif.Σoptim
Jadi pertanyaannya adalah bagaimana memastikan bahwa tetap positif pasti? Saya melihat dua solusi yang mungkin:
Reparametrise sebagai mana adalah matriks segitiga-atas atau simetris. Maka akan selalu positif-pasti dan dapat tidak dibatasi.R R ′ R Σ R
Gunakan kemungkinan profil. Turunkan rumus untuk dan \ hat {\ Sigma} (\ theta) . Mulailah dengan beberapa \ theta_0 dan beralih \ hat {\ Sigma} _j = \ hat \ Sigma (\ hat \ theta_ {j-1}) , \ hat {\ theta} _j = \ hat \ theta (\ hat \ Sigma_ {j -1}) hingga konvergensi. Σ (θ)θ0 Σ j= Σ ( θ j-1) θ j= θ ( Σ j-1)
Apakah ada cara lain dan bagaimana dengan 2 pendekatan ini, apakah akan berhasil, apakah itu standar? Ini sepertinya masalah standar, tetapi pencarian cepat tidak memberi saya petunjuk. Saya tahu bahwa perkiraan Bayesian juga mungkin, tetapi untuk saat ini saya tidak ingin terlibat di dalamnya.
Jawaban:
Dengan asumsi bahwa dalam membangun matriks kovarians, Anda secara otomatis menangani masalah simetri, kemungkinan log Anda akan ketika tidak pasti positif karena istilah dalam model yang tepat? Untuk mencegah kesalahan numerik jika Saya akan menghitung ulang dan, jika tidak positif, maka buat kemungkinan log sama dengan -Jika, jika tidak lanjutkan. Anda harus menghitung faktor penentu, jadi ini tidak dikenakan biaya perhitungan tambahan. Σ log d e t Σ d e t Σ < 0 d e t Σ−∞ Σ logdet Σ det Σ<0 det Σ
sumber
Ternyata Anda dapat menggunakan kemungkinan maksimum profil untuk memastikan properti yang diperlukan. Anda dapat membuktikan bahwa untuk diberikan θ , l ( θ , Σ ) dimaksimalkan olehθ^ l(θ^,Σ)
dimana
Maka dimungkinkan untuk menunjukkan itu
maka kita hanya perlu memaksimalkan
Secara alami dalam hal ini akan memenuhi semua properti yang diperlukan. Buktinya identik untuk kasus ketika f adalah linier yang dapat ditemukan dalam Time Series Analysis oleh JD Hamilton halaman 295, maka saya menghilangkannya.Σ f
sumber
Sebuah parameterisasi alternatif untuk matriks kovarians adalah dalam hal nilai eigen sudut p dan p ( p - 1 ) / 2 "Memberikan" θ i j .λ1,...,λp p ( p - 1 ) / 2 θsayaj
Artinya, kita bisa menulis
di mana adalah ortonormal, danG
dengan .λ1≥ . . . ≥ λhal≥ 0
Sementara itu, dapat diparameterisasi unik dalam hal p ( p - 1 ) / 2 sudut, θ i j , di mana saya = 1 , 2 , . . . , P - 1 dan j = i , . . . , p - 1. [1]G p ( p - 1 ) / 2 θsaya j i = 1 , 2 , . . . , p - 1 j = i , . . . , p - 1
(detail yang akan ditambahkan)
[1]: Hoffman, Raffenetti, Ruedenberg. "Generalisasi Euler Angles ke Matriks Orthogonal N-Dimensi". J. Math. Phys 13, 528 (1972)
sumber
Di sepanjang garis solusi charles.y.zheng, Anda mungkin ingin memodelkan , di mana Λ adalah matriks diagonal, dan C adalah faktorisasi Cholesky dari pembaruan peringkat ke Λ . Anda hanya perlu menjaga diagonal Λ positif untuk menjaga Σ pasti positif. Artinya, Anda harus memperkirakan diagonal Λ dan elemen C alih-alih memperkirakan Σ .Σ = Λ + CC⊤ Λ C Λ Λ Σ Λ C Σ
sumber