Apakah MLE selalu berarti kita mengetahui PDF yang mendasari data kita, dan apakah EM berarti kita tidak tahu?

12

Saya memiliki beberapa pertanyaan konseptual sederhana yang ingin saya klarifikasi mengenai MLE (Estimasi Kemungkinan Maksimum), dan tautan apa yang dimilikinya, jika ada, ke EM (Ekspektasi Maksimalisasi).

Seperti yang saya pahami, jika seseorang berkata "Kami menggunakan MLE", apakah itu secara otomatis berarti bahwa mereka memiliki model eksplisit dari data PDF mereka? Menurut saya jawabannya adalah ya. Dengan kata lain, jika suatu saat seseorang mengatakan "MLE", adalah wajar untuk bertanya kepada mereka apa PDF yang mereka asumsikan. Apakah ini benar?

Terakhir, pada EM, pemahaman saya adalah bahwa dalam EM, kita sebenarnya tidak tahu - atau perlu tahu, PDF yang mendasari data kami. Ini pemahaman saya.

Terima kasih.

Creatron
sumber
1
"M" dalam EM singkatan dari Maksimalisasi ... dari kemungkinan. Untuk menuliskan kemungkinan kita perlu pdf. EM adalah cara untuk menemukan MLE di hadapan 'tidak dapat diobservasi' dalam beberapa hal (yang diisi dalam langkah-E). Artinya, untuk menggunakan EM Anda memerlukan model eksplisit.
Glen_b -Reinstate Monica
@Glen_b Terima kasih Gleb_b. Jadi, 1) apakah benar untuk mengatakan, bahwa dalam EM, seperti dalam MLE, kami selalu mengasumsikan beberapa model data PDF "? Berarti bahwa jika seseorang mengatakan" Kami menggunakan MLE / EM ", kita dapat bertanya," Apa PDF yang Anda asumsikan ". Apakah ini penilaian yang benar? 2) Terakhir, berkenaan dengan EM, saya percaya hal yang tidak dapat diobservasi yang Anda maksudkan adalah probabilitas PDF tertentu yang menyusun campuran, benar? Terima kasih sebelumnya.
Creatron
Perhatikan bahwa ada metode kemungkinan maksimum non-parametrik. Lihatlah Kaplan-Meier.
soakley
Creatron - on (1) Perhatikan bahwa EM adalah suatu algoritma untuk menghitung MLE yang jika tidak akan sulit untuk ditangani. Dalam kedua kasus, saya akan mengajukan pertanyaan yang sedikit lebih umum 'apa model Anda?', Karena sangat mungkin model menjadi lebih kompleks daripada beberapa pdf tunggal. Aktif (2) Algoritma EM tidak hanya berlaku untuk campuran; ini lebih umum dari itu.
Glen_b -Reinstate Monica

Jawaban:

13

Metode MLE dapat diterapkan dalam kasus di mana seseorang mengetahui bentuk fungsional dasar pdf (misalnya, itu Gaussian, atau log-normal, atau eksponensial, atau apa pun), tetapi bukan parameter yang mendasarinya; misalnya, mereka tidak tahu nilai dan σ dalam pdf: f ( x | μ , σ ) = 1μσ atau apa pun jenis pdf lain yang mereka asumsikan. Tugas metode MLE adalah memilih yang terbaik (yaitu, yang paling masuk akal) nilai untuk parameter yang tidak diketahui, mengingat pengukuran tertentu Datax1,x2,x3,. . . yang sebenarnya diamati. Jadi untuk menjawab pertanyaan pertama Anda, ya, Anda selalu berhak menanyakan kepada seseorangbentukpdf apa yang mereka asumsikan untuk perkiraan kemungkinan maksimum; memang, taksiran nilai parameter yang mereka katakan kepada Anda bahkan tidak berarti kecuali mereka pertama kali berkomunikasi konteks itu.

f(x|μ,σ)=12πσ2exp[(xμ)22σ2]
x1,x2,x3,...

f(x|A1,...,AN,μ1,...,μN,σ1,...σN)=k=1NAk2πσk2exp[(xμk)22σk2]
AkNx1,x2,x3,...

NN=1A1μ1σ1N=2A1A2μ1μ2σ1σ2A1μ1σ1N=1N=2

NN

N=1N=2N=3

stachyra
sumber
Ak=1N
N
Ak=1NNN=4N=5
stachyra
Terima kasih, stachyra. Pertanyaan terakhir, PDF dari campuran data luar (diberikan dalam persamaan kedua Anda yang terdiri dari jumlah tertimbang PDF), TIDAK sama dengan PDF gabungan dari semua sampel data kami, yang merupakan produk dari PDF mereka, benar ? (Asumsikan sampel data adalah IID).
Creatron
Tidak, tidak sama sekali - mereka adalah dua hal yang sangat berbeda. Pdf gabungan yang Anda gambarkan terdengar jauh lebih mirip dengan bentuk fungsi kemungkinan yang digunakan dalam MLE. Buku teks mungkin membantu Anda di sini. Untuk MLE, saya suka bab 10 dari "Pengurangan Data dan Analisis Kesalahan untuk Ilmu Fisika" oleh Philip R. Bevington dan D. Keith Robinson, atau bagian 6.1 dari "Analisis Data Statistik" oleh Glen Cowan. Untuk contoh spesifik tentang bagaimana melakukan satu jenis implementasi EM, saya suka penjelasan ini , bagian 2 sampai 5.
stachyra
2

MLE membutuhkan pengetahuan tentang paling tidak distribusi marjinal. Saat menggunakan MLE, kami biasanya mengestimasi parameter distribusi bersama dengan membuat asumsi awal, lalu memfaktorkan distribusi bersama sebagai produk dari marginal, yang kami tahu. Ada variasi, tetapi ini adalah gagasan dalam banyak kasus. Jadi MLE adalah metode parametrik.

Algoritma EM adalah metode untuk memaksimalkan fungsi kemungkinan yang muncul sebagai bagian dari algoritma MLE. Ini sering (biasanya?) Digunakan untuk solusi numerik.

Setiap kali kita menggunakan MLE, kita memerlukan setidaknya distribusi marjinal, dan beberapa asumsi tentang bagaimana sambungan itu terkait dengan marginal (kemerdekaan, dll.). Karena itu kedua metode ini mengandalkan pengetahuan distribusi.

Charles Pehlivanian
sumber
Terima kasih @ Charles yang masuk akal. Apa artinya itu ketika orang berbicara tentang "MLE non-parametrik". Ungkapan itu tidak masuk akal pada pandangan pertama. MLE selalu memperkirakan parameter distribusi, bukan?
Creatron
Mereka mungkin berbicara tentang ELE (Estimasi Empirik Kemungkinan). Saya tidak pernah menggunakannya; Saya akan mencoba menjelaskan jika perlu. Kalau tidak, saya tidak yakin.
Charles Pehlivanian