Apakah bias merupakan properti dari estimator, atau estimasi tertentu?

10

Sebagai contoh, saya sering bertemu siswa yang tahu bahwa Observed adalah penduga yang bias dari Populasi . Kemudian, ketika menulis laporan mereka, mereka mengatakan hal-hal seperti:R 2R2R2

"Saya menghitung Observed dan Adjusted , dan mereka sangat mirip, menunjukkan hanya sedikit bias dalam nilai Observed kami peroleh."R 2 R 2R2R2R2

Saya mendapatkan itu secara umum ketika kita berbicara tentang bias kita biasanya berbicara tentang sifat-sifat penaksir daripada perkiraan tertentu. Namun, apakah pernyataan yang dikutip di atas merupakan penyalahgunaan terminologi, atau apakah itu oke?

user1205901 - Pasang kembali Monica
sumber
1
Seperti biasanya didefinisikan dalam teks statistik matematika, bias ( ) adalah properti dari estimator, bukan dari estimasi tertentu. Tapi, bias juga memiliki arti dari penggunaan sehari-hari, dan itulah yang mungkin siswa maksudkan dalam contoh kedua. Saya pikir apa yang siswa katakan dalam argumen mereka dapat dimengerti, dan menarik, menunjukkan bahwa mereka benar-benar berpikir sendiri, dan tidak hanya mem-parot teks! Jadi, Anda harus menganggap itu sebagai peluang, bukan sekadar menandai sebagai "kesalahan", dan bertanya "apakah argumen yang menarik ini sebenarnya BENAR? Yang akan=E(β^β)
kjetil b halvorsen
.... buat pertanyaan yang bagus di sini!
kjetil b halvorsen
1
Saya kira kekhawatiran saya adalah bahwa ada sejarah yang cukup panjang dalam statistik orang yang mencampuradukkan istilah teknis (mis. "Kepercayaan diri") dengan rekan non-teknis mereka. Saya setuju bahwa garis argumen yang saya baca terdengar cukup masuk akal, terutama karena kecenderungan untuk menghasilkan estimasi yang bias adalah properti pendefinisian yang bias.
user1205901

Jawaban:

8

Dalam statistik, bias jelas merupakan properti dari estimator.

Saya membagikan pengamatan Anda bahwa bias sering kali salah diterapkan pada taksiran. Contoh Anda tampaknya tidak bersalah dalam hal itu, karena instruktur yang bermaksud baik dapat berargumen bahwa siswa Anda berasumsi bahwa kesalahan estimasi sangat kecil sehingga tidak apa-apa untuk menyamakan estimasi dengan estimator.

Contoh yang lebih ekstrem adalah penggunaan kata "bias" untuk kesalahan estimasi tertentu, seperti pada: kita tahu nilai sebenarnya adalah 5, tetapi estimasi kami bias ke atas. Saya merasa ini memang penyalahgunaan terminologi yang pada akhirnya akan menyebabkan kebingungan, dan karena itu seseorang harus menandainya sebagai tidak pantas.

Florian Hartig
sumber
Jika tidak bias, lalu apa yang Anda sebut ketika kita (entah bagaimana) tahu bahwa perkiraan jumlah itu salah?
Repmat
4
Kesalahan en.wikipedia.org/wiki/Estimator#Error
Florian Hartig
3
@Repmat "Ketahuilah bahwa ... itu salah" biasanya bukan cara yang bermanfaat untuk menilai estimator. Dalam banyak keadaan bahkan penaksir terbaik tentu saja salah sepanjang waktu. Ini terjadi bahkan dalam situasi paling sederhana dan paling alami. Misalkan (seperti dalam Needle Problem Buffon), bahwa koin benar-benar memiliki peluang kepala pendaratan dan Anda menggunakan penaksir apa pun yang pernah diusulkan, seperti proporsi kepala yang diamati dalam pelemparan. Karena proporsi itu rasional tetapi tidak rasional, nilai yang dikembalikan oleh penaksir itu tidak akan pernah benar, tidak peduli berapa kali lemparan dilakukan! p n pp=2/πpnp
whuber
6

Bias adalah properti dari estimator.

Sebuah estimator sendiri merupakan variabel acak dan memiliki distribusi (dengan mean dan varians). Ketika penduga memiliki nilai yang diharapkan yang sama dengan yang benar, nilai yang tidak diketahui yang ia coba untuk memperkirakan kami katakan penduga itu tidak bias.

Sekarang, ketika kita menghitung estimasi kita melihat satu pengamatan dari distribusi estimator. Jadi, bahkan jika kita menggunakan definisi bias (salah dan tidak berbahaya dalam konteks ini) yang tampaknya digunakan siswa, ada masalah. Pengamatan tunggal (estimasi), mungkin sangat jauh dari nilai yang diharapkan dari distribusi estimator. Dengan kata lain, ada kemungkinan nilai estimasi sangat jauh dari nilai sebenarnya yang mendasari di mana siswa tampaknya menyiratkan bahwa diamati sangat dekat dengan nilai sebenarnya.R2

TrynnaDoStat
sumber
2
Ya, tetapi pertanyaan yang menarik dan tersirat, tampaknya adalah: Jika, pada model & data yang sama, satu penaksir yang bias dan lainnya, sangat dekat, apakah itu memungkinkan untuk membuat beberapa kesimpulan? yang?
kjetil b halvorsen