Bisakah Anda memberikan contoh penduga MLE dari mean yang bias?
Saya tidak mencari contoh yang merusak penduga MLE secara umum dengan melanggar kondisi keteraturan.
Semua contoh yang dapat saya lihat di internet merujuk pada varians, dan sepertinya saya tidak dapat menemukan apa pun yang terkait dengan mean.
EDIT
@MichaelHardy memberikan contoh di mana kami mendapatkan estimasi yang bias dari rata-rata distribusi seragam menggunakan MLE di bawah model yang diusulkan tertentu.
Namun
https://en.wikipedia.org/wiki/Uniform_distribution_(continuous)#Estimation_of_midpoint
menunjukkan bahwa MLE adalah penaksir rata-rata minimum yang seragam dan seragam, jelas di bawah model lain yang diusulkan.
Pada titik ini, masih belum terlalu jelas bagi saya apa yang dimaksud dengan estimasi MLE jika sangat tergantung pada model yang dihipotesiskan sebagai lawan untuk mengatakan penduga rata-rata sampel yang merupakan model netral. Pada akhirnya saya tertarik untuk memperkirakan sesuatu tentang populasi dan tidak benar-benar peduli tentang estimasi parameter dari model hipotesis.
EDIT 2
Seperti @ChristophHanck menunjukkan model dengan informasi tambahan yang diperkenalkan bias tetapi tidak berhasil mengurangi MSE.
Kami juga memiliki hasil tambahan:
http://www.maths.manchester.ac.uk/~peterf/CSI_ch4_part1.pdf (p61) http://www.cs.tut.fi/~hehu/SSP/lecture6.pdf (slide 2) http: / /www.stats.ox.ac.uk/~marchini/bs2a/lecture4_4up.pdf (slide 5)
"Jika ada penaksir tidak bias yang paling efisien ˆθ dari (ada (yaitu ˆθ tidak bias dan variansnya sama dengan CRLB) maka metode estimasi kemungkinan maksimum akan menghasilkannya."
"Selain itu, jika ada penduga yang efisien, itu adalah penduga ML."
Karena MLE dengan parameter model bebas tidak bias dan efisien, menurut definisi apakah ini "the" Estimator Kemungkinan Maksimum?
EDIT 3
@AlecosPapadopoulos memiliki contoh dengan distribusi Setengah Normal di forum matematika.
/math/799954/can-the-maximum-likelihood-estimator-be-unprice-and-fail-to-achieve-cramer-rao
Itu tidak berlabuh salah satu parameternya seperti dalam kasus seragam. Saya akan mengatakan bahwa menyelesaikannya, meskipun dia belum menunjukkan bias dari estimator rata-rata.
sumber
Jawaban:
Christoph Hanck belum memposting rincian contoh yang diusulkannya. Saya mengerti maksudnya distribusi seragam pada interval berdasarkan pada sampel awal X 1 , …[0,θ], ukuran lebih dari n = 1.X1,…,Xn n=1.
Rata adalah .θ/2
MLE dari rata-rata adalahmax{X1,…,Xn}/2.
Itu bias sejak jadi E ( maks /Pr(max<θ)=1, E(max/2)<θ/2.
PS: Mungkin kita harus mencatat bahwa penaksir tidak bias terbaik dari rata-rata adalahθ/2 tidak sampel berarti, melainkan adalah Sampel rata-rata adalah penaksir burukθ
Saya menduga distribusi Pareto adalah kasus lain. Inilah ukuran probabilitas: Nilai yang diharapkan adalah α
Saya belum menghitung nilai yang diharapkan dari MLE untuk mean, jadi saya tidak tahu apa biasnya.
sumber
Berikut adalah contoh yang menurut saya beberapa mengejutkan:
Dalam regresi logistik, untuk setiap ukuran sampel hingga dengan hasil non-deterministik (yaitu ), setiap estimasi koefisien regresi tidak hanya bias, rata-rata koefisien regresi sebenarnya tidak terdefinisi.0<pi<1
Ini karena untuk setiap ukuran sampel yang terbatas, ada probabilitas positif (walaupun sangat kecil jika jumlah sampel besar dibandingkan dengan jumlah parameter regresi) untuk mendapatkan pemisahan hasil yang sempurna. Ketika ini terjadi, estimasi koefisien regresi akan menjadi atau ∞ . Memiliki probabilitas positif menjadi - ∞ atau ∞ menyiratkan nilai yang diharapkan tidak terdefinisi.−∞ ∞ −∞ ∞
Untuk lebih lanjut tentang masalah khusus ini, lihat efek Hauck-Donner .
sumber
Meskipun @MichaelHardy telah menyatakan maksudnya, berikut adalah argumen yang lebih terperinci tentang mengapa MLE maksimum (dan karenanya, rata-rataθ/2 , dengan invarian) tidak bias, meskipun dalam model yang berbeda (lihat edit di bawah).
Kami memperkirakan batas atas dari distribusi seragam . Di sini, y ( n ) adalah MLE, untuk sampel acak y . Kami menunjukkan bahwa y ( n ) tidak bias. Cdf-nya adalah F y ( n ) ( xU[0,θ] y(n) y y(n)
Jadi, densitasnya adalah
fy(n)(x)={n
EDIT 2: Untuk menguraikan poin Henry, berikut adalah sedikit simulasi untuk MSE dari penduga rata-rata, menunjukkan bahwa sementara MLE jika kita tidak tahu batas bawahnya nol adalah tidak bias, MSE untuk dua varian identik. , menunjukkan bahwa estimator yang menggabungkan pengetahuan batas bawah mengurangi variabilitas.
sumber
Melengkapi di sini kelalaian dalam jawaban saya di math.se dirujuk oleh OP,
Log-kemungkinan sampel adalah
The first derivative with respect tov is
so it is a method of moments estimator. It is unbiased since,
But, the resulting estimator for the mean is downward biased due to Jensen's inequality
sumber
The famous Neyman Scott problem has an inconsistent MLE in that it never even converges to the right thing. Motivates the use of conditional likelihood.
Take(Xi,Yi)∼N(μi,σ2) . The MLE of μi is (Xi+Yi)/2 and of σ2 is σ^2=∑ni=11ns2i with s2i=(Xi−μ^i)2/2+(Yi−μ^i)2/2=(Xi−Yi)2/4 which has expected value σ2/4 and so biased by a factor of 2.
sumber
There is an infinite range of examples for this phenomenon since
sumber