Saya mengerti di mana langkah E terjadi dalam algoritma (seperti yang dijelaskan dalam bagian matematika di bawah). Dalam pikiran saya, kecerdikan kunci dari algoritma adalah penggunaan ketidaksetaraan Jensen untuk membuat batas bawah pada kemungkinan log. Dalam hal itu, mengambil Expectation
hanya dilakukan untuk merumuskan kembali kemungkinan log agar sesuai dengan ketidaksetaraan Jensen (yaitu untuk fungsi cekung.)
Apakah ada alasan mengapa E-step disebut? Apakah ada signifikansi pada hal yang kita harapkan (yaitu ? Saya merasa seperti kehilangan intuisi di balik mengapa Ekspektasi itu begitu sentral, daripada sekadar bersifat insidental terhadap penggunaan ketidaksetaraan Jensen.
EDIT: Tutorial mengatakan:
Nama 'E-step' berasal dari fakta bahwa seseorang biasanya tidak perlu untuk membentuk distribusi probabilitas atas penyelesaian secara eksplisit, tetapi lebih perlu hanya menghitung statistik yang cukup 'diharapkan' atas penyelesaian ini.
Apa artinya "seseorang biasanya tidak perlu membentuk distribusi probabilitas atas penyelesaian secara eksplisit"? Seperti apa distribusi probabilitas itu?
Lampiran: E-langkah dalam algoritma EM
sumber
Jawaban:
Harapan adalah inti dari algoritma EM. Untuk memulainya, kemungkinan terkait dengan data(x1,…,xn) direpresentasikan sebagai harapan
Intuisi di balik EM juga didasarkan pada harapan. Sejakcatatanp (x1, ... ,xn; θ ) tidak dapat dioptimalkan secara langsung, sementara catatanp (x1, ... ,xn,z1, ... ,zn; θ ) bisa tetapi tergantung pada yang tidak teramati zsaya Idenya adalah untuk memaksimalkan kemungkinan log lengkap yang diharapkan
sumber
Jawaban Xi'an sangat bagus, hanya beberapa ekstensi mengenai hasil edit.
Karena nilaiz tidak diamati, kami memperkirakan distribusi qx(z) untuk setiap titik data x sebagai qx(z)
completions
data teramati. Fungsi Q adalah jumlah kemungkinan log yang diharapkan berakhirYang disebutkanp(x,z|θ) . Untuk beberapa distribusi (terutama keluarga eksponensial, karena kemungkinannya ada dalam bentuk log-nya), kita hanya perlu tahu yang diharapkan Q(θ) .
probability distribution over completions
harus merujuksufficient statistics
(bukan kemungkinan yang diharapkan) untuk menghitung dan memaksimalkanAda pengantar yang sangat bagus dalam Bab 19.2 dari Model Grafis Probabilistik.
sumber