Bantuan dalam Maksimalisasi Ekspektasi dari kertas: bagaimana memasukkan distribusi sebelumnya?

9

Pertanyaannya didasarkan pada makalah berjudul: Rekonstruksi gambar dalam tomografi optik difus menggunakan model transport-difusi radiatif digabungkan

Tautan unduhan

Penulis menerapkan EM algoritma dengan sparsity regularisasi vektor yang tidak diketahui untuk memperkirakan pixel dari suatu gambar. Model ini diberikan oleh μl1μ

(1)y=Aμ+e
Estimasi diberikan dalam Persamaan (8) sebagai

(2)μ^=argmaxlnp(y|μ)+γlnp(μ)

Dalam kasus saya, saya telah mempertimbangkan sebagai filter dengan panjang dan adalah vektor yang mewakili filter. Begitu,L μ L × 1μLμL×1

Model dapat ditulis ulang sebagai

(3)y(n)=μTa(n)+v(n)

Pertanyaan: Perumusan masalah: (n oleh 1) adalah input yang tidak teramati dan adalah mean nol dengan varians tidak diketahui noise tambahan. Solusi MLE akan didasarkan pada Ekspektasi Maksimalisasi (EM). { e ( n ) } σ 2 eμ(n){e(n)}σe2

Dalam makalah Eq (19) adalah fungsi - log-likelihood lengkap tetapi untuk kasus saya, saya tidak mengerti bagaimana saya bisa memasukkan distribusi dalam ekspresi log-likelihood lengkap. AA,μ

Apa yang akan menjadi log-likelihood lengkap menggunakan EM dari termasuk distribusi sebelumnya?y

SKM
sumber
Apakah Anda benar-benar menginginkan kemungkinan log atau sebaliknya Anda menginginkan log-posterior? Hanya yang terakhir akan menyertakan Laplacian prior. Yang pertama hanya dapat diperoleh dengan mengambil log dari kemungkinan, yang tampaknya Anda sudah menulis
Ada dua ekspresi yang saya inginkan - (1) Satu yang akan digunakan untuk menemukan Matriks Informasi Fisher dan (2) lainnya adalah pdf dari kumpulan data lengkap yang mencakup variabel tersembunyi dan pengamatan yang merupakan gabungan kepadatan probabilitas dari data yang diamati sebagai fungsi dari parameter . Pdf yang saya tulis berlaku untuk model MA untuk estimasi buta . Tetapi, bagaimana perbedaannya untuk batasan sparsity = Laplacian sebelumnya sehingga Matriks Informasi Fisher dari turunan parsial dari kemungkinan log dapat ditemukan. θ θZθθ
SKM
@ Xi'an: Saya tidak mengerti bagaimana memasukkan 3 pdf yang termasuk sebelumnya dalam perumusan kemungkinan log. Saya dapat bekerja di luar maksimalisasi yang mengambil turunan parsial dan menyamakan dengan nol. Bisakah Anda memberikan jawaban dengan ekspresi kemungkinan secara tertulis. Ini akan sangat membantu
SKM

Jawaban:

3

Jika kita menganggap target sebagai representasi pada basis EM adalah untuk sembarang , karena dekomposisi atau yang bekerja untuk nilai arbitrer dari (karena tidak ada pada lhs ) dan karenanya juga berfungsi untuk setiap harapan dalam : log L ( θ | x ) = E [ log L ( θ | x , Z ) | x , θ ] - E [ log q

argmaxθL(θ|x)π(θ)=argmaxθlogL(θ|x)+logπ(θ)
logL(θ|x)=E[logL(θ|x,Z)|x,θ]E[logq(Z|x,θ)|x,θ]
θ
q(z|x,θ)=f(x,z|θ)/g(x|θ)
g(x|θ)=f(x,z|θ)/q(z|x,θ)
zZ
logg(x|θ)=logf(x,z|θ)logq(z|x,θ)=E[logf(x,Z|θ)logq(Z|x,θ)|x]
untuk setiap distribusi bersyarat diberikan , misalnya . Karenanya jika kita memaksimalkan dalam dengan solusi kita memiliki sementara oleh argumen standar EM. Karenanya, ZX=xq(z|x,θ)θ
E[logL(θ|x,Z)|x,θ]+logπ(θ)
θ1
E[logL(θ1|x,Z)|x,θ]+logπ(θ1)E[logL(θ|x,Z)|x,θ]+logπ(θ)
E[logq(Z|x,θ)|x,θ]E[logq(Z|x,θ1)|x,θ]
E[logL(θ1|x,Z)|x,θ]+logπ(θ1)E[logL(θ|x,Z)|x,θ]+logπ(θ)
dan menggunakan sebagai langkah E target mengarah ke peningkatan posterior di setiap M langkah, yang berarti bahwa algoritma EM yang dimodifikasi menyatu ke MAP lokal.
E[logL(θ|x,Z)|x,θ]+logπ(θ)
Xi'an
sumber
Terimakasih atas balasan anda. Apakah mewakili pdf dari ? Bisakah Anda menjelaskan mengapa ada 2 ekspektasi dengan dikurangkan dalam Persamaan yang disebutkan di baris kedua? Z E [ l o g q ( . ) ]q()ZE[logq(.)]
SKM
Saya menambahkan beberapa penjelasan, tetapi Anda harus memeriksa derivasi algoritma EM di buku teks karena ini adalah materi standar.
Xi'an
1

Saya tidak berpikir menunjukkan peningkatan monoton log-posterior (atau log kemungkinan untuk MLE) cukup untuk menunjukkan konvergensi ke titik stasioner dari estimasi MAP (atau MLE). Misalnya, peningkatannya bisa menjadi kecil secara sewenang-wenang. Dalam makalah terkenal oleh Wu 1983 , kondisi yang cukup untuk konvergen ke titik stasioner EM adalah diferensiabilitas dalam kedua argumen fungsi batas bawah.

Jim.Z
sumber