Saya mencoba memahami EM dan mencoba menyimpulkan parameter model ini menggunakan teknik ini, tetapi saya mengalami kesulitan memahami bagaimana memulainya:
Jadi, saya memiliki model regresi linier tertimbang sebagai berikut di mana saya memiliki pengamatan dan pengamatan yang sesuai . Model hubungan antara X dan Y adalah model regresi linier tertimbang dan asumsi distribusi adalah sebagai berikut:
Di sini adalah parameter regresi dan model memungkinkan untuk varians yang tidak sama dengan memiliki variabel respon untuk memiliki bobot individu pada varians. Tujuan saya adalah menemukan hubungan linear yang paling mungkin diberikan oleh parameter .
Jadi, saya sekarang dapat menulis log-posterior sebagai berikut:
Sekarang, saya telah mencoba untuk memahami EM dan tidak yakin bahwa pemahaman saya belum lengkap tetapi seperti yang saya mengerti, untuk mulai memperkirakan parameter, saya mulai dengan mengambil ekspektasi dari distribusi log-posterior sehubungan dengan parameter laten / tersembunyi yang dalam kasus saya adalah dan . Jadi nilai yang diharapkan ini diperlukan akan:
Namun, saya tidak tahu bagaimana melanjutkan dari sini untuk menghitung harapan ini. Sangat menghargai saran apa pun tentang langkah selanjutnya. Saya tidak mencari seseorang untuk mendapatkan saya semua hal yang diperlukan tetapi hanya dorongan ke arah yang benar pada apa yang harus saya cari untuk diselesaikan pada langkah selanjutnya.
Jawaban:
Biarkan saya mengingat dasar-dasar algoritma EM terlebih dahulu. Ketika mencari estimasi kemungkinan maksimum dari kemungkinan bentuk algoritma tersebut melanjutkan dengan memaksimalkan secara berulang (M) yang diharapkan (E) kemungkinan log-likelihood lengkap, yang menghasilkan pemaksimalan (dalam ) pada iterasi fungsi Algoritma karena itu harus dimulai dengan mengidentifikasi variabel laten dan distribusi kondisionalnya.
Dalam kasus Anda tampaknya variabel laten adalah dibuat dari sementara parameter yang menarik adalah . Jika Anda memproses dan sebagai variabel laten, tidak ada parameter yang tersisa untuk dioptimalkan. Namun, ini juga berarti bahwa sebelum tidak digunakan.ϖ wi β β ϖ β
Jika kita melihat lebih tepat pada kasus , distribusi kondisionalnya diberikan oleh yang memenuhi syarat sebagai distribusi.wi
Kemungkinan log yang selesai adalah bagian yang bergantung pada disederhanakan sebagai dan fungsi sebanding dengan Memaksimalkan fungsi ini dalam jumlah ke regresi linier tertimbang, dengan bobot
sumber