Apakah penduga efisien efisien tidak bias dominan secara stokastik dibandingkan dengan penduga tidak bias (median) lainnya?

9

Gambaran umum

Apakah estimator yang efisien (yang memiliki varians sampel sama dengan batas Cramér-Rao) memaksimalkan probabilitas untuk menjadi dekat dengan parameter sebenarnya ?θ

Katakanlah kita membandingkan perbedaan atau perbedaan absolut antara taksiran dan parameter sebenarnya

Δ^=θ^-θ

Apakah distribusi untuk estimator efisien yang secara stokastik dominan di atas distribusi untuk estimator tidak bias lainnya?Δ^Δ~


Motivasi

Saya memikirkan hal ini karena pertanyaan Pengukur yang optimal di bawah semua fungsi yang masuk akal (evaluasi) dimana kita dapat mengatakan bahwa penaksir terbaik yang tidak bias sehubungan dengan satu fungsi kerugian cembung juga merupakan penaksir terbaik yang tidak bias sehubungan dengan fungsi kerugian lainnya (Dari Iosif Pinelis, 2015, Karakterisasi estimator terbaik yang tidak bias. ArXiv preprint arXiv: 1508.07636 ). Dominasi stokastik karena dekat dengan parameter sebenarnya tampaknya sama dengan saya (ini adalah kondisi yang cukup, dan pernyataan yang lebih kuat).


Ekspresi yang lebih tepat

Pernyataan pertanyaan di atas adalah luas, misalnya jenis ketidakberpihakan apa yang dipertimbangkan dan apakah kita memiliki metrik jarak yang sama untuk perbedaan negatif dan positif?

Mari kita perhatikan dua kasus berikut untuk membuat pertanyaan kurang luas:

Dugaan 1: Jika adalah penaksir rata-rata dan median yang tidak bias. Kemudian untuk setiap penaksir rata-rata dan rata-rata mana danθ^θ~

if x>0 kemudian P[Δ^x]P[Δ~x]jika x<0 kemudian P[Δ^x]P[Δ~x]
Δ^=θ^-θΔ~=θ~-θ

Dugaan 2: Jika adalah estimator rata-rata yang efisien. Kemudian untuk setiap penaksir rata-rata yang tidak bias danθ^θ~x>0

P[|Δ^|x]P[|Δ~|x]

  • Apakah dugaan di atas benar?
  • Jika proposisi terlalu kuat, dapatkah kita menyesuaikannya agar berhasil?

Yang kedua terkait dengan yang pertama tetapi menjatuhkan batasan untuk median-bias (dan kemudian kita perlu mengambil kedua sisi bersama-sama atau proposisi akan menjadi salah untuk setiap penaksir yang memiliki median yang berbeda dari penaksir yang efisien).


Contoh, ilustrasi:

Pertimbangkan estimasi mean dari distribusi populasi (yang diasumsikan berdistribusi normal) oleh (1) median sampel dan (2) sampel berarti.μ

Dalam kasus sampel ukuran 5, dan ketika distribusi sebenarnya dari populasi adalah ini terlihat sepertiN(0,1)

contoh cdf

Dalam gambar kita melihat bahwa CDF terlipat dari mean sampel (yang merupakan penaksir efisien untuk ) berada di bawah CDF yang dilipat dari median sampel. Pertanyaannya adalah apakah CDF yang dilipat dari mean sampel berada di bawah CDF yang dilipat dari estimator yang tidak bias lainnya.μ

Sebagai alternatif, dengan menggunakan CDF alih-alih CDF terlipat, kita dapat mengajukan pertanyaan apakah CDF rata-rata memaksimalkan jarak dari 0,5 di setiap titik. Kita tahu bahwa

θ^:|FmeSebuahn(θ^)-0,5||FmedsayaSebuahn(θ^)-0,5|

apakah kita juga punya ini ketika kita ganti Fmedian(θ^) untuk distribusi penaksir rata-rata dan median-tidak bias lainnya?

Sextus Empiricus
sumber
2
Periksa Pitman nearnesskata kunci, bukan karena saya menemukan kriteria ini masuk akal.
Xi'an
1
Dari dugaan tersebut, tampaknya lebih masuk akal untuk menggunakan penaksir median-bias daripada penduga rata-rata. (Penaksir yang tidak sesuai ada dalam beberapa pengaturan dan tidak bias terbaik dalam pengaturan yang lebih sedikit.)
Xi'an
1
'Kriteria kedekatan Pitman' memang menarik. Berdasarkan informasi di wikipedia saya melihatnya sebagai "probabilitas untuk perbedaan absolut menjadi lebih dekat". Ini sedikit berbeda. Kriteria kedekatan Pitman ini dapat menciptakan kasus menarik di mana beberapa penaksir rata-rata memiliki perbedaan absolut yang lebih kecil tetapi tidak menang sesuai dengan kriteria kedekatan ini.
Sextus Empiricus
1
Kriteria yang Anda usulkan adalah invarian dengan transformasi monoton bijective, tetapi mean-bias tidak, sedangkan median-bias adalah. Ini juga sangat kuat dalam halθ^ harus di atas cdf dari θ~ atas θ dan di bawah cdf dari θ~ di bawah θ, untuk semua nilai parameter θ.
Xi'an
1
@ Xi'an Saya telah menambahkan contoh visual dan sekarang saya mendapatkan komentar Anda tentang bias-median versus bias-rata. Saya telah menyesuaikan pertanyaan (meskipun itu menyimpang dari ide awal saya terkait dengan pertanyaan terkait yang membutuhkan beberapa penyesuaian yang lebih kompleks sekarang).
Sextus Empiricus

Jawaban:

5

Berikut ini adalah percobaan dalam kasus non-standar, masalah lokasi Cauchy, di mana non-standar berarti bahwa tidak ada penduga merata terbaik yang seragam. Mari kita perhatikan(X1,...,XN) sampel dari Cauchy C(μ,1)distribusi dan empat penaksir invarian berikutμ:

  1. μ^1=median(X1,...,XN)=X(N/2)
  2. μ^2=berarti(X(N/4),...,X(3N/4))=2N(X(N/4)+...+X(3N/4))
  3. μ^3=μMLE mana yang efisien
  4. μ^4=μ^1+2Nμ(μ^1)

Kemudian membandingkan cdf dari empat penaksir mengarah ke gambar ini, di mana cdf dari μ^3 (emas) dan μ^4 (tomat) dapat dibandingkan, dan membaik μ^1 (Steelblue), itu sendiri membaik μ^2 (sienna). masukkan deskripsi gambar di sini

Representasi perbedaan pada cdf empiris MLE membuatnya lebih jelas:

masukkan deskripsi gambar di sini

Berikut adalah kode R yang sesuai:

T=1e4
N=11
mlechy=function(x){
  return(optimize(function(theta) -sum(dcauchy(x, 
    location=theta, log=TRUE)),  c(-100,100))$minimum)
}
est=matrix(0,T,4)
for (t in 1:T){
cauc=sort(rcauchy(N))
est[t,1]=median(cauc)
est[t,2]=mean(cauc[4:8])
est[t,3]=mlechy(cauc)
est[t,4]=est[t,1]+(4/N)*sum((cauc-est[t,1])/(1+(cauc-est[t,1])^2))
}

plot(ecdf(est[,1]),col="steelblue",cex=.4,xlim=c(-1,1),main="",ylab="F(x)")
plot(ecdf(est[,2]),add=TRUE,col="sienna",cex=.4)
plot(ecdf(est[,3]),add=TRUE,col="gold",cex=.4)
plot(ecdf(est[,4]),add=TRUE,col="tomato",cex=.4)
Xi'an
sumber
1
Bukankah seharusnya kurva emas (perbedaan MLE empiris dengan dirinya sendiri) menjadi nol dalam plot perbedaan.
Sextus Empiricus
Buruk saya, saya mengubah kode warna: tomat untuk perbedaan dengan yang keempat, emas untuk perbedaan dengan Pitman, sienna untuk perbedaan dengan rata-rata yang dipangkas, dan biru untuk perbedaan dengan median.
Xi'an