Saya bingung tentang metode kemungkinan maksimum dibandingkan dengan misalnya menghitung rata-rata aritmatika.
Kapan dan mengapa kemungkinan maksimum menghasilkan estimasi "lebih baik" daripada mis. Aritmatika? Bagaimana ini bisa diverifikasi?
maximum-likelihood
mavavilj
sumber
sumber
Jawaban:
Sementara rata-rata aritmatika mungkin terdengar sebagai penaksir "alami", orang dapat bertanya mengapa itu harus lebih disukai daripada MLE! Satu-satunya properti pasti yang terkait dengan rata-rata aritmatika adalah bahwa itu adalah penaksir yang tidak bias dari E [ X ]x¯ E[X] ketika ekspektasi ini didefinisikan. (Pikirkan distribusi Cauchy sebagai contoh tandingan.) Yang belakangan memang menikmati berbagai properti dalam kondisi keteraturan pada fungsi kemungkinan. Untuk meminjam dari halaman wikipedia , MLE adalah
Dibandingkan dengan rata-rata aritmatika, sebagian besar properti tersebut juga puas untuk distribusi yang cukup teratur. Kecuali 4 dan 5. Dalam kasus keluarga eksponensial, MLE dan rata-rata aritmatika identik untuk memperkirakan parameter dalam parameterisasi rata-rata (tetapi tidak untuk parameterisasi lainnya). Dan MLE ada untuk sampel dari distribusi Cauchy.
Namun, ketika beralih ke properti optimalitas sampel terbatas seperti minimaxity atau diterimanya, mungkin terjadi bahwa MLE bukanlah minimax atau tidak dapat diterima. Sebagai contoh, efek Stein menunjukkan ada estimator dengan risiko kuadratik yang lebih kecil untuk semua nilai parameter di bawah beberapa kendala pada distribusi sampel dan dimensi parameter. Ini adalah kasus ketika dan p ≥ 3 .x∼Np(θ,Ip) p≥3
sumber
Mari kita menafsirkan "menghitung rata-rata aritmatika" sebagai estimasi menggunakan Method of Moments (MoM). Saya percaya itu setia pada pertanyaan awal karena metode ini menggantikan rata-rata sampel dengan yang teoritis. Ini juga mengatasi kekhawatiran @ Xi'an tentang parameter arbitrer (dari model arbitrer).
Jika Anda masih bersama saya, maka saya pikir tempat yang bagus untuk pergi adalah Contoh di mana metode momen dapat mengalahkan kemungkinan maksimum dalam sampel kecil?Teks pertanyaan menunjukkan bahwa "Penaksir kemungkinan maksimum (MLE) efisien secara asimptot; kami melihat hasil praktis karena sering kali lebih baik daripada perkiraan metode momen (MoM) (bila berbeda)," dan mencari kasus-kasus tertentu di mana penduga MoM mencapai kesalahan kuadrat rata-rata yang lebih kecil daripada rekan MLE-nya. Beberapa contoh yang disediakan adalah dalam konteks regresi linier, distribusi Invers Gaussian dua parameter, dan distribusi daya eksponensial asimetris.
Gagasan "efisiensi asimptotik" ini berarti bahwa penaksir kemungkinan maksimum mungkin hampir menggunakan data secara maksimal (untuk memperkirakan parameter yang dipermasalahkan), jaminan yang tidak Anda dapatkan dengan metode momen secara umum. Sementara kemungkinan maksimum tidak selalu "lebih baik" daripada bekerja dengan rata-rata, properti efisiensi ini (jika hanya dalam batasnya) menjadikannya metode masuk akal bagi kebanyakan frekuensi. Tentu saja, pelawan bisa berpendapat bahwa dengan meningkatnya ukuran set data, jika Anda menunjuk target yang tepat dengan fungsi rata-rata, ikuti saja.
sumber
Ada beberapa contoh terkenal di mana kemungkinan maksimum (ML) tidak memberikan solusi terbaik. Lihat makalah Lucien Le Cam 1990: "Kemungkinan Maksimum: pengantar" [1] , yang berasal dari kuliahnya yang diundang di Univ. dari Maryland.
Contoh yang paling saya sukai, karena sangat mudah, adalah ini:
I won't ruin the fun by giving you the answer, but (no surprise) there are two ways to solve this using ML and they give different solutions. One is the "arithmetic mean" of the squared residuals (as one would expect), and the other is half the arithmetic mean. You can find the answer here on my Github page.
sumber