Untuk distribusi apa yang dipangkas berarti penaksir kemungkinan maksimum?

8

Sampel rata-rata adalah penduga kemungkinan maksimum μ untuk distribusi normal Normal(μ,σ). Median sampel adalah penaksir kemungkinan maksimum sebesarmuntuk distribusi Laplace Laplace(m,s) (Juga disebut distribusi eksponensial ganda).

Apakah distribusi ada dengan parameter lokasi yang berarti rata-rata sampel yang dipangkas adalah penaksir kemungkinan maksimum?

Rasmus Bååth
sumber

Jawaban:

9

Distribusi, jika ada, diperoleh sebagai integral dari persamaan estimasi. Mari kita asumsikan untuk kesederhanaan bahwa parameter skala diketahui, dan parameter pemangkasan, jika ada, diperbaiki.

  1. Untuk mean sampel, persamaan estimasi adalah
    E(xμ)=0.
    Membayangkan bahwa ini adalah turunan dari log-kemungkinan, dengan banyak sekali penyalahgunaan notasi dan kehilangan ketelitian, kami memiliki
    dlnl(μ;x)dμ=xμ,lnl(μ;x)=a(xμ)2,l(μ;x)exp[a(xμ)2],
    Dimana a parameter (konstanta integrasi) harus negatif untuk memastikan bahwa ia berintegrasi ke sesuatu yang bermakna.
  2. Untuk median sampel, persamaan estimasi adalah
    Esign(xμ)=0.
    Integrasikan ini untuk mendapatkan
    l(μ;x)exp[a|xμ|],
    di mana lagi kita harus memilih a menjadi negatif masuk akal.
  3. Untuk mean yang dipangkas, persamaan estimasi adalah
    Eρ(x,μ,c)=0,ρ(x,μ,c)={xμ,|xμ|c,0,|xμ|>c.
    Mari kita lihat apa yang diintegrasikan ke:
    l(μ;x,c)={exp[a(xμ)2],|xμ|c,b,|xμ|>c.
    Tampak seperti normal yang disensor di tengah, tetapi lihat ekornya: mereka tidak tepat jika b>0. Jadi untuk mendapatkan distribusi yang tepat, kita harus mengaturb=0. Tetapi kemudian kita memiliki inkonsistensi logis: distribusi ini harus memberikan nol pdf untuk beberapa data aktual dalam ekor yang dipangkas. Ini kontradiktif dengan diri sendiri, dan menunjukkan beberapa efek samping pemangkasan yang tidak diinginkan.

Kadang-kadang, menguntungkan untuk membangun "kemungkinan" dari suatu metode untuk menunjukkan normalitas asimptotiknya, dan efisiensi untuk kelas distribusi yang sempit. Secara umum, normalitas asimptotik dari rata yang dipangkas dapat mengikuti dari teoriM- perkiraan.

Tugas
sumber
1
Apakah itu benar-benar persamaan estimasi dari rata yang dipangkas? Dalam persamaan Andac tampaknya menjadi konstanta yang "membuang" data itu cjauh dari rata-rata sementara dalam versi biasa berarti Anda menentukan proporsi titik data yang harus dibuang dari ekor dari data. Bukankah kedua hal ini berbeda atau apakah saya kehilangan sesuatu?
Rasmus Bååth
Ya, memang agak berbeda - saya mengatakan bahwa saya memperlakukan konstanta pemangkasan sebagai tetap. Menjadikannya sebagai data-dependen akan mempersulit hal-hal, tetapi saya percaya pada akhirnya akan mengarah pada kesimpulan yang sama bahwa beberapa titik data "tidak mungkin" di bawah distribusi yang tersirat oleh "kemungkinan".
Tugas
4

Kasus-kasus khusus seperti median samping, saya tidak berpikir bahwa cara yang dipangkas umumnya ML; jika ya, mereka sudah menjadi semacam penaksir-M. Namun, jika Anda mengambil distribusi yang normal di tengah dengan, katakanlah, ekor eksponensial - distribusi yang sesuai dengan penaksir Huber M - maka untuk tingkat pemangkasan tertentu, mean yang dipangkas akan diharapkan menjadi sangat efisien.

Glen_b -Reinstate Monica
sumber