Saya telah menemukan masalah dalam buku teks untuk memperkirakan rata-rata. Masalah buku teks adalah sebagai berikut:
Asumsikan bahwa titik data, , ,. . . , , telah dihasilkan oleh pdf Gaussian satu dimensi dengan mean yang tidak diketahui, tetapi dari varian yang diketahui. Turunkan estimasi ML rata-rata.
Pertanyaan saya adalah, Mengapa kita perlu memperkirakan rata-rata menggunakan MLE ketika kita sudah tahu bahwa rata-rata adalah data? Solusinya juga mengatakan bahwa estimasi MLE adalah rata-rata data. Apakah saya perlu melakukan semua langkah MLE memaksimalkan memaksimalkan untuk mengetahui bahwa rata-rata hanyalah rata-rata data yaitu ?
self-study
normal-distribution
maximum-likelihood
Niranjan Kotha
sumber
sumber
Jawaban:
Masalah buku teks menyatakan itux1,x2,…,xN adalah dari
Benarkah itu perkiraan yang bagusμ^=x¯ ?!
Sini,x¯=1N∑Ni = 1xsaya .
Itu tidak jelas bagi saya, dan saya cukup terkejut melihat bahwa itu sebenarnya perkiraan MLE.
Juga, pertimbangkan ini: bagaimana jikaμ dikenal dan σ tidak diketahui? Dalam hal ini penaksir MLE adalah
Perhatikan, bagaimana estimator ini tidak sama dengan estimator varians sampel! Jangan "kita sudah tahu" bahwa varians sampel diberikan oleh persamaan berikut?
sumber
Dalam hal ini, rata-rata sampel Anda terjadi untuk juga menjadi estimator maksimum likelihood. Jadi melakukan semua pekerjaan itu MLE terasa seperti latihan yang tidak perlu, karena Anda kembali ke perkiraan intuitif Anda tentang rata-rata yang akan Anda gunakan di tempat pertama. Yah, ini bukan "kebetulan"; ini dipilih secara khusus untuk menunjukkan bahwa estimator MLE sering mengarah pada estimator intuitif.
Tetapi bagaimana jika tidak ada estimator intuitif? Misalnya, Anda memiliki sampel variabel acak gamma iid dan Anda tertarik untuk memperkirakan bentuk dan parameter laju. Mungkin Anda bisa mencoba mengeluarkan estimator dari properti yang Anda ketahui tentang distribusi Gamma. Tapi apa cara terbaik untuk melakukannya? Menggunakan beberapa kombinasi estimasi mean dan varians? Mengapa tidak menggunakan estimasi median sebagai ganti mean? Atau log-mean? Ini semua bisa digunakan untuk membuat semacam penaksir, tapi mana yang bagus?
Ternyata, teori MLE memberi kita cara yang bagus untuk secara ringkas mendapatkan jawaban atas pertanyaan itu: ambil nilai-nilai parameter yang memaksimalkan kemungkinan data yang diamati (yang tampaknya cukup intuitif) dan menggunakannya sebagai perkiraan Anda. Bahkan, kami memiliki teori yang menyatakan bahwa dalam kondisi tertentu, ini akan menjadi penaksir terbaik. Ini jauh lebih baik daripada mencoba mencari penaksir unik untuk setiap jenis data dan kemudian melangkah banyak waktu mengkhawatirkan jika itu benar-benar pilihan terbaik.
Singkatnya: sementara MLE tidak memberikan wawasan baru dalam hal memperkirakan rata-rata data normal , MLE secara umum adalah alat yang sangat, sangat berguna.
sumber
Ini adalah masalah kosakata yang membingungkan, seperti yang diilustrasikan oleh kutipan itu, langsung dari google:
Bukan definisi terbaik, saya setuju! Terutama ketika menyarankan berarti sebagai sinonim. Saya akan berpikir rata - rata paling tepat untuk dataset atau sampel sepertix¯ dan tidak boleh digunakan untuk distribusi, karena μ di N(μ,σ²) .
Seperti yang disarankan oleh entri Wikipedia ini , berarti berlaku untuk distribusi dan sampel atau kumpulan data. Mean dari dataset atau sampel juga merupakan rata-rata dari distribusi empiris yang terkait dengan sampel ini. Entri juga mencontohkan kemungkinan kebingungan antara istilah karena memberikan rata-rata dan harapan sebagai sinonim.
Saya akan membatasi penggunaan harapan untuk objek yang diperoleh oleh integral, seperti pada
sumber