Apakah rata-rata kuadrat kesalahan digunakan untuk menilai superioritas relatif satu penaksir atas yang lain?

13

Misalkan kita memiliki dua penduga α1 dan α2 untuk beberapa parameter x . Untuk menentukan estimator mana yang "lebih baik" apakah kita melihat MSE (mean squared error)? Dengan kata lain kita melihat

M.SE=β2+σ2
mana β adalah bias dari estimator dan σ2 adalah varians dari estimator? Manakah yang memiliki MSE lebih besar adalah penaksir yang lebih buruk?
Damien
sumber

Jawaban:

10

Jika Anda telah dua estimator bersaing q 1 dan θ 2 , apakah atau tidak M S E ( θ 1 ) < M S E ( θ 2 ) memberitahu Anda bahwa θ 1 adalah estimator yang lebih baik tergantung sepenuhnya pada definisi Anda "terbaik". Misalnya, jika Anda membandingkan berisi estimator dan dengan "lebih baik" yang Anda maksud memiliki varians lebih rendah maka, ya, ini akan berarti bahwa θ 1 lebih baik. M S Eθ^1θ^2

M.SE(θ^1)<M.SE(θ^2)
θ^1θ^1M.SEadalah kriteria populer karena hubungannya dengan Least Squares dan Gaussian log-likelihood tetapi, seperti banyak kriteria statistik, satu harus berhati-hati dari menggunakan membabi buta sebagai ukuran kualitas estimator tanpa memperhatikan aplikasi.M.SE

Ada situasi tertentu di mana memilih estimator untuk meminimalkan mungkin tidak menjadi hal yang sangat masuk akal untuk dilakukan. Dua skenario muncul dalam pikiran:M.SE

  • Jika ada outlier yang sangat besar dalam kumpulan data maka mereka dapat mempengaruhi MSE secara drastis dan dengan demikian estimator yang meminimalkan MSE dapat dipengaruhi oleh outlier seperti itu. Dalam situasi seperti itu, fakta bahwa estimator meminimalkan MSE tidak benar-benar memberi tahu Anda banyak karena, jika Anda menghapus outlier (s), Anda bisa mendapatkan perkiraan yang sangat berbeda. Dalam hal itu, MSE tidak "kuat" untuk outlier. Dalam konteks regresi, fakta inilah yang memotivasi Penaksir-M Huber (yang saya bahas dalam jawaban ini), yang meminimalkan fungsi kriteria yang berbeda (yaitu campuran antara kesalahan kuadrat dan kesalahan absolut) ketika ada kesalahan berekor panjang .

  • Jika Anda memperkirakan parameter dibatasi, membandingkan s mungkin tidak tepat karena menghukum lebih dan understimation berbeda dalam kasus itu. Sebagai contoh, misalkan Anda memperkirakan varians, σ 2 . Kemudian, jika Anda sadar meremehkan kuantitas Anda M S E dapat paling σ 4 , sementara terlalu tinggi dapat menghasilkan M S E yang jauh melebihi σ 4 , bahkan mungkin dengan jumlah yang tak terbatas.M.SEσ2M.SEσ4M.SEσ4

Untuk membuat kelemahan ini lebih jelas, saya akan memberikan contoh konkret ketika, karena masalah ini, tidak mungkin ukuran yang tepat dari kualitas estimator.M.SE

Misalkan Anda memiliki sampel dari t distribusi dengan ν > 2 derajat kebebasan dan kami mencoba untuk memperkirakan varians, yang merupakan ν / ( ν - 2 ) . Pertimbangkan dua estimator bersaing: θ 1 : t h e u n b i a s e d s a m p l e v a r iX1,...,Xntν>2ν/(ν-2) dan θ 2 = 0 , r e g a r d l e s s o f t h e d a t a Jelas M S E ( θ 2 ) = ν 2

θ^1:the kamunbsayaSebuahsed sSebuahmhalle vSebuahrsayaSebuahnce
θ^2=0, regSebuahrdless Haif the dSebuahtSebuah
dan itu adalah kenyataan bahwaMSE( θ 1)={jika  ν 4 ν 2M.SE(θ^2)=ν2(ν-2)2yang dapat diturunkan menggunakanfakta yang dibahas dalam utas inidansifat-sifatdistribusi-t. Dengan demikian melebihi estimator naif dalam halMSEterlepas dari ukuran sampel setiap kaliν<4, yang agak membingungkan. Itu juga mengungguli ketika(2
M.SE(θ^1)={jika ν4ν2(ν-2)2(2n-1+6n(ν-4))jika ν>4.
tM.SEν<4tetapi ini hanya relevan untuk ukuran sampel yang sangat kecil. Di atas terjadi karena sifat ekor panjang daritdistribusi dengan derajat kecil kebebasan, yang membuat θ 2rentan terhadap nilai-nilai yang sangat besar danMSEmenghukum berat untuk terlalu tinggi, sementara θ 1tidak memiliki masalah ini.(2n1+6n(ν4))>1tθ^2MSEθ^1

MSEMSEθ^

S(θ^)=θ^ν/(ν-2)-1-catatan(θ^ν/(ν-2))

S(θ^1)=

Makro
sumber
(+1) Diskusi yang bagus. Agar adil, mungkin harus ditunjukkan bahwa argumen yang sama dapat dibuat untuk dan terhadap kriteria lain (fungsi kerugian lainnya) juga.
MånsT
2
Biasanya, seseorang mengevaluasi estimator dengan melihat fungsi risikonya, yang memplot perkiraan kerugian versus parameter. Di sini, dengan memperbaiki parameter, Anda mungkin telah menghasilkan analisis yang menyesatkan. Lagi pula, selalu merupakan hal yang membuat penaksir bodoh (konstan, data-bodoh) dapat menghasilkan kerugian yang diharapkan sangat rendah: cukup setel dengan parameter yang benar! Ini membuat saya bertanya-tanya apa simulasi yang sebenarnya ditampilkan di sini.
whuber
@whuber, saya telah memodifikasi jawaban ini untuk memberikan contoh secara analitis, yang membuatnya lebih jelas mungkin. Saya juga menawarkan fungsi kerugian alternatif yang mungkin lebih sesuai.
Makro
ν
2

L(αi)=(αiα)2

JMS
sumber
2

Karena fungsinya f(x)=x2dapat dibedakan, itu membuat menemukan MSE minimum lebih mudah dari sudut pandang teoritis dan numerik. Sebagai contoh, dalam kuadrat terkecil biasa Anda dapat memecahkan kejelasan untuk kemiringan dan penyadapan yang dipasang. Dari sudut pandang numerik, Anda memiliki pemecah yang lebih efisien saat Anda memiliki turunan juga.

Kesalahan kuadrat rata-rata biasanya melebihi bobot outlier menurut saya. Inilah sebabnya mengapa sering lebih kuat untuk menggunakan kesalahan absolut rata-rata, yaitu penggunaanf(x)=|x|sebagai fungsi kesalahan Anda. Namun, karena tidak dapat dibedakan, itu membuat solusi lebih sulit untuk dikerjakan.

MSE mungkin merupakan pilihan yang baik jika istilah kesalahan didistribusikan secara normal. Jika mereka memiliki ekor yang lebih gemuk, pilihan yang lebih kuat seperti nilai absolut lebih disukai.

aprokopiw
sumber
0

Dalam Case & Berger Statistical Inference edisi ke-2 Halaman 332 menyatakan bahwa MSE memberikan penalti yang sama untuk perkiraan yang terlalu tinggi dan terlalu rendah, yang tidak masalah dalam kasus lokasi. Namun, dalam kasus skala, 0 adalah batas bawah alami, sehingga masalah estimasi tidak simetris. Penggunaan MSE dalam hal ini cenderung memaafkan terlalu rendah.

Anda mungkin ingin memeriksa penaksir mana yang memenuhi properti UMVUE, yang berarti menggunakan Cramer-Rao Batas bawah. Halaman 341.

Tu.2
sumber