Pertimbangkan kemungkinan log campuran Gaussians:
Saya bertanya-tanya mengapa sulit secara komputasi untuk memaksimalkan persamaan itu secara langsung? Saya mencari intuisi yang jelas tentang mengapa harus jelas bahwa itu sulit atau mungkin penjelasan yang lebih keras mengapa sulit. Apakah ini masalah NP-complete atau kita belum tahu bagaimana menyelesaikannya? Apakah ini alasan kami menggunakan algoritma EM ( ekspektasi-maksimalisasi )?
Notasi:
= data pelatihan.
= titik data.
= himpunan parameter yang menentukan Gaussian, meannya, standar deviasi, dan probabilitas menghasilkan titik dari setiap klaster / kelas / Gaussian.
= probabilitas menghasilkan titik dari cluster / class / Gaussian i.
Selain poin juampa, izinkan saya memberi sinyal kesulitan-kesulitan itu:
diambil dari buku saya .
Komentar tambahan: tanpa memanggil algoritma EM, seseorang dapat menggunakan algoritma optimasi standar (seperti Newton-Raphson) satu parameter pada satu waktu, yaitu, iterate
sumber