Penaksir kemungkinan maksimum (MLE) efisien secara asimptotik; kami melihat hasil praktis dalam hal mereka sering melakukan lebih baik daripada estimasi metode saat (MoM) (ketika mereka berbeda), bahkan pada ukuran sampel kecil
Di sini 'lebih baik daripada' berarti dalam arti biasanya memiliki varians yang lebih kecil ketika keduanya tidak bias, dan biasanya lebih kecil mean square error (MSE) lebih umum.
Namun, timbul pertanyaan:
Apakah ada kasus di mana Kemenkeu dapat mengalahkan MLE - pada MSE , katakanlah - dalam sampel kecil?
(di mana ini bukan situasi yang aneh / merosot - yaitu mengingat bahwa kondisi untuk ML ada / menjadi pegangan yang efisien asimptotik)
Pertanyaan selanjutnya adalah 'seberapa besar kecil?' - yaitu, jika ada contoh, apakah ada beberapa yang masih memiliki ukuran sampel yang relatif besar, bahkan mungkin semua ukuran sampel terbatas?
[Saya bisa menemukan contoh estimator yang bias yang bisa mengalahkan ML dalam sampel hingga, tetapi itu bukan MoM.]
Catatan ditambahkan secara retrospektif: fokus saya di sini terutama pada kasus univariat (yang sebenarnya merupakan asal rasa ingin tahu saya yang mendasari). Saya tidak ingin mengesampingkan kasus multivariat, tetapi saya juga tidak terlalu ingin menyimpang ke diskusi panjang estimasi James-Stein.
Jawaban:
Ini mungkin dianggap ... curang, tetapi estimator OLS adalah estimator MoM. Pertimbangkan spesifikasi regresi linier standar (dengan regresi stokastik , sehingga besarnya tergantung pada matriks regresi), dan sampel ukuran . Nyatakan penaksir OLS dari varians dari istilah kesalahan. Itu tidak bias begitun s 2 σ 2K n s2 σ2
Pertimbangkan sekarang MLE dari . iniσ2
⇒MSE( σ 2 M L )=2(n-K)+K2
Kami menginginkan kondisi (jika ada) di mana
Mengingat ini, akar untuk quadratic adalahK
Secara keseluruhan: untuk ukuran sampel dan jumlah regresi sehingga kami memiliki Untuk Sebagai contoh, jika maka seseorang menemukan bahwa jumlah regressor harus untuk ketidaksamaan yang ada. Sangat menarik bahwa untuk sejumlah kecil regresi, MLE lebih baik dalam arti MSE.n>12 K ⌈K1⌉<K<⌊K2⌋
ADDENDUMK
Persamaan untuk akar quadratic dapat ditulis
sumber
"Dalam artikel ini, kami mempertimbangkan parametriisasi baru dari distribusi Inverse Gaussian dua parameter. Kami menemukan estimator untuk parameter distribusi Inverse Gaussian dengan metode momen dan metode kemungkinan maksimum. Lalu, kami membandingkan efisiensi dari penduga untuk dua metode berdasarkan bias dan mean square error (MSE) .Untuk ini kita memperbaiki nilai parameter, menjalankan simulasi, dan melaporkan MSE dan bias untuk estimasi yang diperoleh oleh kedua metode .Kesimpulannya adalah ketika ukuran sampel adalah 10, metode momen cenderung lebih efisien daripada metode kemungkinan maksimum untuk estimasi kedua parameter (lambda dan theta) .... " baca lebih lanjut
Saat ini orang tidak dapat (atau tidak seharusnya) mempercayai semua yang dipublikasikan, tetapi halaman terakhir makalah ini tampak menjanjikan. Saya harap ini membahas catatan Anda ditambahkan secara retrospektif.
sumber
Menurut simulasi yang dijalankan oleh Hosking dan Wallis (1987) dalam "Estimasi Parameter dan Kuantil untuk Distribusi Pareto Umum", parameter distribusi Pareto umum dua-parameter yang diberikan oleh cdf
atau kepadatannya
lebih dapat diandalkan jika mereka diperkirakan dengan MOM dibandingkan dengan ML. Ini berlaku untuk sampel hingga ukuran 500. Perkiraan MOM diberikan oleh
dan
dengan
Makalah ini berisi beberapa kesalahan ketik (setidaknya versi saya lakukan). Hasil untuk penduga MOM yang diberikan di atas disediakan oleh "heropup" di utas ini .
sumber
Saya menemukan satu:
Untuk distribusi daya eksponensial asimetris
hasil simulasi Delicado dan Goria (2008) menunjukkan bahwa untuk beberapa parameter pada ukuran sampel yang lebih kecil, metode momen dapat mengungguli MLE; misalnya dalam dikenal- kasus pada ukuran sampel 10, ketika memperkirakan , MSE dari MoM lebih kecil dari untuk ML.θ σ
Delicado dan Goria (2008),
Sebuah sampel kecil perbandingan kemungkinan maksimum, momen dan metode L-momen untuk distribusi daya eksponensial asimetris,
Jurnal Statistik Komputasi & Analisis Data
Volume 52 Edisi 3, Januari, hal 1661-1673
(juga lihat http://www-eio.upc.es/~delicado/my-public-files/LmomAEP.pdf )
sumber
Metode saat (MM) dapat mengalahkan pendekatan kemungkinan maksimum (ML) ketika dimungkinkan untuk menentukan hanya beberapa saat populasi. Jika distribusi tidak jelas, estimator ML tidak akan konsisten.
Dengan asumsi momen terbatas dan pengamatan awal, MM dapat memberikan penaksir yang baik dengan sifat asimptotik yang bagus.
Contoh: Misalkan menjadi contoh pertama dari , di mana adalah fungsi kepadatan probabilitas yang tidak diketahui. Tentukan yang saat th dan menganggap bahwa bunga adalah untuk memperkirakan sebagainya saat .X1,…,Xn X∼f f:R→R+ νk=∫Rxkf(x)dx k ν4
Biarkan , lalu dengan mengasumsikan bahwa , teorema batas pusat menjamin bahwa mana " " berarti "konvergen dalam distribusi ke" . Apalagi dengan teorema Slutsky,Xk¯=1n∑ni=1Xki ν8<∞
Artinya, kita dapat menarik (perkiraan) inferensi untuk dengan menggunakan pendekatan momen (untuk sampel besar), kita hanya perlu membuat beberapa asumsi pada momen populasi yang menarik. Di sini, penaksir kemungkinan maksimum tidak dapat didefinisikan tanpa mengetahui bentuk . fν4 f
Studi Simulasi:
Patriota et al. (2009) melakukan beberapa studi simulasi untuk memverifikasi tingkat penolakan pengujian hipotesis dalam model kesalahan-dalam-variabel. Hasilnya menunjukkan bahwa pendekatan MM menghasilkan tingkat kesalahan di bawah hipotesis nol lebih dekat ke tingkat nominal daripada ML untuk sampel kecil.
Catatan sejarah:
Metode momen diusulkan oleh K. Pearson pada tahun 1894 "Kontribusi Teori Matematika Evolusi". Metode kemungkinan maksimum diusulkan oleh RA Fisher pada tahun 1922 "Pada Yayasan Matematika Statistik Teoritis". Kedua makalah tempat diterbitkan dalam Transaksi Filsafat Royal Society of London, Seri A.
Referensi:
Fisher, RA (1922). Tentang Yayasan Matematika Statistik Teoritis, Transaksi Filsafat Royal Society of London, Seri A, 222, 309-368.
Patriota, AG, Bolfarine, H, de Castro, M (2009). Model kesalahan struktural variabel heteroskedastik dengan kesalahan persamaan, Metodologi Statistik 6 (4), 408-423 ( pdf )
Pearson, K (1894). Kontribusi untuk Teori Matematika Evolusi, Transaksi Filsafat Royal Society of London, Seri A, 185, 71-110.
sumber
Sumber tambahan yang mendukung IBU:
Hong, HP, dan W. Ye. 2014. Analisis beban salju tanah ekstrim untuk Kanada menggunakan catatan kedalaman salju . Bahaya Alam 73 (2): 355-371.
Martins, ES, dan JR Stedinger. 2000. Penaksir kuantil maksimum-kemungkinan umum yang digeneralisasi untuk data hidrologi . Penelitian Sumberdaya Air 36 (3): 737-744.
Abstrak:
Di bagian Pengantar dan Tinjauan Pustaka mereka mengutip makalah tambahan yang menyimpulkan bahwa MOM dalam beberapa kasus mengungguli MLE (lagi-lagi pemodelan nilai ekstrim), misalnya
K (kappa) adalah parameter bentuk GEV.
makalah yang muncul dalam tanda kutip:
Hosking J, Wallis J, Wood E (1985) Estimasi distribusi nilai ekstrim umum dengan metode probabilitas tertimbang momen . Technometrics 27: 251-261.
Madsen, H., PF Rasmussen dan D. Rosbjerg (1997) Perbandingan seri maksimum tahunan dan metode seri durasi parsial untuk pemodelan peristiwa hidrologi ekstrem , 1, pemodelan di tempat, Water Resour. Res., 33 (4), 747-758.
Hosking, JRM, L-saat: Analisis dan estimasi distribusi menggunakan kombinasi linear dari statistik pesanan , JR Stat. Soc., Ser. B, 52, 105-124, 1990.
Selain itu, saya memiliki pengalaman yang sama seperti yang disimpulkan dalam makalah di atas, dalam hal memodelkan peristiwa ekstrem dengan ukuran sampel kecil dan sedang (<50-100 yang khas) MLE dapat memberikan hasil yang tidak realistis, simulasi menunjukkan bahwa MOM lebih kuat dan memiliki RMSE yang lebih kecil.
sumber
Dalam proses menjawab ini: Memperkirakan parameter untuk binomial saya tersandung makalah ini:
Ingram Olkin, A John Petkau, James V Zidek: Perbandingan N estimator untuk Distribusi Binomial. Jasa 1981.
yang memberikan contoh di mana metode momen, setidaknya dalam beberapa kasus, mengalahkan kemungkinan maksimum. Masalahnya adalah estimasi dalam distribusi binomial mana kedua parameter tidak diketahui. Tampaknya misalnya dalam mencoba untuk memperkirakan kelimpahan hewan ketika Anda tidak dapat melihat semua hewan, dan penampakan probabilitas juga tidak diketahui.Bin ( N , p ) hlmN Bin(N,p) p
sumber