Apakah kita pernah menggunakan estimasi kemungkinan maksimum?

14

Saya bertanya-tanya apakah estimasi kemungkinan maksimum pernah digunakan dalam statistik. Kami belajar konsep itu tetapi saya bertanya-tanya kapan itu benar-benar digunakan. Jika kita mengasumsikan distribusi data, kita menemukan dua parameter, satu untuk mean dan satu untuk varians, tetapi apakah Anda benar-benar menggunakannya dalam situasi nyata?

Adakah yang bisa memberi tahu saya kasus sederhana yang digunakan untuk itu?

pengguna122358
sumber
33
Ini adalah metode estimasi paling umum. itu
JohnK
3
Saya mencoba bertanya kapan kita tidak menggunakan MLE
Haitao Du
4
regresi logistik. Regresi Poisson. OLS adalah MLE ketika kesalahan dianggap normal. Regresi gamma. Setiap GLM klasik benar-benar. Memperkirakan rata-rata dari populasi normal. Memperkirakan probabilitas keberhasilan dari serangkaian uji coba binomial. Memperkirakan tingkat kejadian poisson. Saya bisa melanjutkan ...
GoF_Logistic
4
Pencarian situs kami yang sangat sempit ini menghasilkan ratusan contoh penggunaan aktual.
whuber
6
@ hxd1011 Anda tidak menggunakan MLE saat Anda tidak menggunakan metodenya untuk mendapatkan varian estimasi atau untuk menghitung interval kepercayaan, prediksi, atau toleransi, misalnya, bahkan ketika estimator yang Anda gunakan mungkin kebetulan setuju dengan estimator MLE. Misalnya, Anda tidak menggunakan MLE saat menjalankan uji-t. Anda sering tidak menggunakannya saat menerapkan estimator yang tidak bias. Secara filosofis, Anda tidak akan menggunakan MLE ketika Anda peduli dengan fungsi kerugian atau Anda memiliki distribusi sebelumnya.
whuber

Jawaban:

25

Saya bertanya-tanya apakah estimasi kemungkinan maksimum pernah digunakan dalam statistik.

Pasti! Sebenarnya cukup banyak - tetapi tidak selalu.

Kami belajar konsep itu tetapi saya bertanya-tanya kapan itu benar-benar digunakan.

Ketika orang memiliki model distribusi parametrik, mereka cukup sering memilih untuk menggunakan estimasi kemungkinan maksimum. Ketika model sudah benar, ada sejumlah properti berguna dari penduga kemungkinan maksimum.

Sebagai contoh - penggunaan model linier umum cukup luas dan dalam hal itu parameter yang menggambarkan rata-rata diperkirakan dengan kemungkinan maksimum.

Dapat terjadi bahwa beberapa parameter diperkirakan dengan kemungkinan maksimum dan yang lainnya tidak. Sebagai contoh, pertimbangkan Poisson GLM yang overdispersi - parameter dispersi tidak akan diestimasi dengan kemungkinan maksimum, karena MLE tidak berguna dalam kasus tersebut.

Jika kita mengasumsikan distribusi data, kita menemukan dua parameter

Yah, kadang-kadang Anda mungkin memiliki dua, tetapi kadang-kadang Anda memiliki satu parameter, kadang tiga atau empat atau lebih.

satu untuk mean dan satu untuk varians,

Apakah Anda memikirkan model tertentu? Ini tidak selalu terjadi. Pertimbangkan memperkirakan parameter distribusi eksponensial atau distribusi Poisson, atau distribusi binomial. Dalam setiap kasus tersebut, ada satu parameter dan varians adalah fungsi dari parameter yang menggambarkan rata-rata.

Atau pertimbangkan distribusi gamma umum , yang memiliki tiga parameter. Atau distribusi beta empat parameter , yang memiliki (mungkin tidak mengejutkan) empat parameter. Perhatikan juga bahwa (tergantung pada parameterisasi tertentu) mean atau varians atau keduanya mungkin tidak diwakili oleh parameter tunggal tetapi oleh fungsi beberapa dari mereka.

Sebagai contoh, distribusi gamma, di mana ada tiga parameterisasi yang melihat penggunaan yang cukup umum - dua yang paling umum memiliki kedua mean dan varians yang berfungsi dari dua parameter.

Biasanya dalam model regresi atau GLM, atau model bertahan hidup (di antara banyak jenis model lainnya), model mungkin tergantung pada beberapa prediktor, dalam hal ini distribusi yang terkait dengan setiap pengamatan di bawah model mungkin memiliki salah satu parameter sendiri (atau bahkan beberapa parameter) yang terkait dengan banyak variabel prediktor ("variabel independen").

Glen_b -Reinstate Monica
sumber
5
"Ketika orang memiliki model distribusi parametrik." Jangan lupa estimasi kemungkinan maksimum non-parametrik, untuk memasukkan kemungkinan empiris.
Mark L. Stone
3
@ Mark Relatif lebih jarang, meskipun. Saya akan menambahkan kata ke jawaban saya.
Glen_b -Reinstate Monica
Bisakah kita menggunakan estimasi kemungkinan maksimum walaupun kita menganggap distribusi, misalnya, adalah normal? Saya pikir kita tidak perlu tetapi kita masih bisa menggunakannya, benarkan?
user122358
@ user122358 Glen dan Mark sudah menjawab Anda. Anda dapat mengambil distribusi atau tidak. Sebagian besar waktu Anda mengasumsikan distribusi dan dengan demikian kemungkinan berfungsi.
HelloWorld
3
"Ketika orang memiliki model distribusi parametrik." Jangan lupa estimasi kemungkinan maksimum semi-parametrik, untuk memasukkan kemungkinan parsial. ;)
Scortchi
8

Sementara estimator kemungkinan maksimum dapat terlihat mencurigakan mengingat asumsi pada distribusi data, Kuasi Estimasi Kemungkinan Maksimal sering digunakan. Idenya adalah memulai dengan mengasumsikan distribusi dan menyelesaikan untuk MLE, kemudian menghapus asumsi distribusi eksplisit dan alih-alih melihat bagaimana kinerja estimator Anda dalam kondisi yang lebih umum. Jadi Kuasi MLE hanya menjadi cara cerdas untuk mendapatkan estimator, dan sebagian besar pekerjaan kemudian menurunkan properti estimator. Karena asumsi distribusi dijatuhkan, kuasi MLE biasanya tidak memiliki sifat efisiensi yang bagus.

x1,x2,...,xnXXN(μ,σ2)σ^2=n1(xix¯)2σ^2

Igor
sumber
Selain itu, Anda dapat memeriksa utas ini di intuisi di belakang Quasi MLE.
Richard Hardy
5

Estimasi kemungkinan maksimum sering digunakan dalam pembelajaran mesin untuk melatih:

Perhatikan bahwa dalam beberapa kasus seseorang lebih suka menambahkan beberapa regularisasi, yang kadang-kadang setara dengan estimasi posteriori Maksimum , misalnya Mengapa penalti Lasso setara dengan eksponensial ganda (Laplace) sebelumnya? .

Franck Dernoncourt
sumber
3

Adakah yang bisa memberi tahu saya kasus sederhana yang digunakan untuk itu?

Kasus yang sangat khas adalah dalam regresi logistik. Regresi logistik adalah teknik yang sering digunakan dalam pembelajaran mesin untuk mengklasifikasikan poin data. Misalnya, regresi logistik dapat digunakan untuk mengklasifikasikan apakah email adalah spam atau bukan spam atau mengklasifikasikan apakah seseorang memiliki atau tidak memiliki penyakit.

xihθ(xi)=P[yi=1]=11+eθTxi

θ

θ^i=1nyilog(hθ^(xi))+(1yi)log(1hθ^(xi))

pengguna35734
sumber
1

Kami menggunakan MLE sepanjang waktu, tetapi kami mungkin tidak merasakannya. Saya akan memberikan dua contoh sederhana untuk ditampilkan.

Contoh 1

810θθ=0.8

Mengapa menggunakan penghitungan? ini sebenarnya secara implisit menggunakan MLE! Di mana masalahnya

Maximizeθ   θ8(1θ)2

Untuk menyelesaikan persamaan, kita perlu beberapa kalkulus, tetapi kesimpulannya adalah penghitungan.

Contoh 2

Bagaimana kita mengestimasi parameter distribusi Gaussian dari data? Kami menggunakan mean empiris sebagai taksiran rata-rata dan varians empiris sebagai taksiran varians, yang juga berasal dari MLE !.

Haitao Du
sumber
6
Contoh 1 juga merupakan solusi Bayes dan solusi metode saat (MM) (dan mungkin itu solusi menggunakan prosedur lain juga). Contoh 2 adalah solusi MM. Akan jauh lebih meyakinkan untuk menunjukkan prosedur yang secara eksklusif MLE - karena jika tidak, orang tidak akan pernah membutuhkan MLE.
whuber
Mengapa contoh 1 menjadi solusi Bayes dan Contoh 2 menjadi solusi MM? Ngomong-ngomong, apa itu MM?
user122358
@ user122358 MM adalah metode momen. Lihat di sini, misalnya: en.wikipedia.org/wiki/Method_of_moments_(statistics)
jld
0

Beberapa kemungkinan penggunaan maksimum dalam komunikasi nirkabel:

  • Decoding data digital dari sinyal yang diterima berisik, dengan atau tanpa kode redundan.
  • Estimasi waktu-, fase-, dan offset frekuensi pada penerima.
  • Perkiraan (parameter dari) saluran propagasi.
  • Estimasi keterlambatan, sudut kedatangan, dan pergeseran Doppler (mis. Radar).
  • Estimasi posisi seluler (mis., GPS).
  • Perkiraan offset jam untuk sinkronisasi semua jenis pengaturan yang didistribusikan.
  • Banyak prosedur kalibrasi.
GDumphart
sumber