Contoh Stein menunjukkan bahwa estimasi kemungkinan maksimum variabel terdistribusi normal dengan rata-rata dan varians tidak dapat diterima (di bawah fungsi kuadrat kerugian) iff . Untuk bukti yang rapi, lihat bab pertama Inferensi Skala Besar: Metode Empiris Bayes untuk Estimasi, Pengujian, dan Prediksi oleh Bradley Effron.
Pertanyaan saya agak: Apa properti dari ruang dimensional (untuk ) yang tidak yang memfasilitasi contoh Stein? Kemungkinan jawaban bisa tentang kelengkungan bola, atau sesuatu yang sama sekali berbeda.
Dengan kata lain, mengapa MLE diterima di ?
Sunting 1: Menanggapi kekhawatiran @mpiktas tentang 1,31 mengikuti dari 1,30:
jadiKarena itu kami memiliki:
Sunting 2 : Dalam makalah ini , Stein membuktikan bahwa MLE dapat diterima untuk .
Jawaban:
Dikotomi antara kasus dan untuk penerimaan MLE dari rata-rata variabel acak normal multivariat dimensional pasti mengejutkan.d<3 d≥3 d
Ada contoh lain yang sangat terkenal dalam probabilitas dan statistik di mana ada dikotomi antara kasus dan . Ini adalah pengulangan dari jalan acak sederhana pada kisi . Yaitu, jalan acak sederhana dimensional berulang dalam 1 atau 2 dimensi, tetapi bersifat sementara dalam dimensi. Analog waktu kontinu (dalam bentuk gerak Brown) juga berlaku.d<3 d≥3 Zd d d≥3
Ternyata keduanya terkait erat.
Larry Brown membuktikan bahwa kedua pertanyaan itu pada dasarnya setara. Artinya, yang terbaik invarian estimator dari berdimensi multivariat vektor rata-rata normal adalah diterima jika dan hanya jika berdimensi gerak Brown berulang.μ^≡μ^(X)=X d d
Bahkan, hasilnya jauh lebih baik. Untuk setiap penaksir yang masuk akal (yaitu, generalisasi Bayes) dengan risiko terikat (digeneralisasi) , ada risiko difusi dimensi (!) Yang eksplisit (!) Yang sesuai sehingga estimator dapat diterima jika dan hanya jika difusinya berulang.μ~≡μ~(X) L2 d μ~
Mean lokal difusi ini pada dasarnya adalah perbedaan antara dua penduga, yaitu, dan kovarians difusi adalah . Dari ini, mudah untuk melihat bahwa untuk kasus MLE , kami memulihkan (mengubah skala) gerakan Brown.μ~−μ^ 2I μ~=μ^=X
Jadi, dalam beberapa hal, kita dapat melihat pertanyaan penerimaan melalui lensa proses stokastik dan menggunakan sifat difusi yang dipelajari dengan baik untuk sampai pada kesimpulan yang diinginkan.
Referensi
sumber
@ cardinal memberikan jawaban yang bagus (+1), tetapi seluruh masalah tetap misterius kecuali ada yang akrab dengan buktinya (dan saya tidak). Jadi saya pikir pertanyaannya tetap tentang apa alasan intuitif bahwa paradoks Stein tidak muncul di dan .R R2
Saya menemukan sangat membantu perspektif regresi yang ditawarkan dalam Stephen Stigler, 1990, A Galtonian Perspective on Shrinkage Estimators . Pertimbangkan pengukuran independen , masing-masing mengukur beberapa yang mendasarinya (tidak teramati) dan disampel dari . Jika kami entah bagaimana mengetahui , kami dapat membuat pasangan:Xi θi N(θi,1) θi (Xi,θi)
Garis diagonal sesuai dengan nol noise dan estimasi sempurna; pada kenyataannya noise tidak nol dan sehingga titik-titik tersebut dipindahkan dari garis diagonal dalam arah horizontal . Sejalan dengan itu, dapat dilihat sebagai garis regresi on . Kami, bagaimanapun, tahu dan ingin memperkirakan , jadi kami harus mempertimbangkan garis regresi pada - yang akan memiliki kemiringan yang berbeda, bias secara horizontal , seperti yang ditunjukkan pada gambar (garis putus-putus).θ=X θ=X X θ X θ θ X
Mengutip dari makalah Stigler:
Dan sekarang datang sedikit penting (penekanan ditambahkan):
Saya pikir ini membuatnya sangat jelas apa yang spesial tentang dan .k=1 k=2
sumber