Misalkan adalah estimator yang tidak bias untuk . Maka tentu saja, . θE[ θ |θ]=θ
Bagaimana seseorang menjelaskan hal ini kepada orang awam? Di masa lalu, apa yang saya katakan adalah jika Anda rata-rata banyak nilai , karena ukuran sampel semakin besar, Anda mendapatkan perkiraan yang lebih baik dari . q
Bagi saya, ini bermasalah. Saya pikir apa yang sebenarnya saya jelaskan di sini adalah fenomena tidak memihak yang asimptotis ini , bukannya semata-mata tidak memihak, yaitu, mana \ hat {\ theta} kemungkinan tergantung pada n .
Jadi, bagaimana seseorang menjelaskan apa yang merupakan penduga yang tidak bias bagi seorang awam?
bias
asymptotics
unbiased-estimator
estimators
communication
Klarinetis
sumber
sumber
Jawaban:
Secara teknis apa yang Anda gambarkan ketika Anda mengatakan bahwa estimator Anda semakin mendekati nilai sebenarnya ketika ukuran sampel bertambah (seperti yang disebutkan orang lain) konsistensi, atau konvergensi estimator statistik. Konvergensi ini dapat berupa konvergensi dalam probabilitas, yang mengatakan bahwa untuk setiap , atau hampir yakin konvergensi yang mengatakan bahwa . Perhatikan bagaimana batas sebenarnya di dalamlimn→∞P(|θ^n−θ|>ϵ)=0 ϵ>0 P(limn→∞|θ^n−θ|>ϵ)=0 probabilitas dalam kasus kedua. Ternyata bentuk konvergensi yang terakhir ini lebih kuat daripada yang lain, tetapi keduanya pada dasarnya berarti hal yang sama, yaitu bahwa perkiraan tersebut cenderung semakin dekat dengan hal yang kami perkirakan saat kami mengumpulkan lebih banyak sampel.
Titik halus di sini adalah bahwa bahkan ketika baik dalam probabilitas atau hampir pasti, secara umum tidak benar bahwa , jadi konsistensi tidak menyiratkan ketidakberpihakan asimptotik seperti yang Anda sarankan. Anda harus berhati-hati ketika berpindah di antara urutan variabel acak (yang merupakan fungsi) ke urutan harapan (yang integral).θ^n→θ limn→∞E(θ^n)=θ
Selain semua hal teknis, tidak bias hanya berarti . Jadi, ketika Anda menjelaskannya kepada seseorang, katakan saja jika percobaan diulangi dalam kondisi yang sama berkali-kali maka nilai rata-rata estimasi akan mendekati nilai sebenarnya.E(θ^n)=θ
sumber
Saya tidak yakin jika Anda mengacaukan konsistensi dan ketidakberpihakan.
Konsistensi: Semakin besar ukuran sampel, semakin kecil varians estimator.
Ketidaktepatan: Nilai yang diharapkan dari estimator sama dengan nilai sebenarnya dari parameter
Jadi, kalimat Anda
Tidak benar. Sekalipun ukuran sampel menjadi tak terbatas, estimator yang tidak bias akan tetap menjadi estimator yang tidak bias, mis. Jika Anda memperkirakan mean sebagai "rata-rata +1", Anda dapat menambahkan satu miliar pengamatan ke sampel Anda dan estimator Anda masih tidak akan memberi Anda nilai sebenarnya.
Di sini Anda dapat menemukan diskusi yang lebih mendalam tentang perbedaan antara konsistensi dan ketidakberpihakan.
Apa perbedaan antara estimator konsisten dan estimator tidak bias?
sumber
@ Ferdi sudah memberikan jawaban yang jelas untuk pertanyaan Anda, tetapi mari kita membuatnya sedikit lebih formal.
Mari menjadi sampel Anda variabel acak independen dan terdistribusi secara identik dari distribusi . Anda tertarik untuk memperkirakan kuantitas yang tidak diketahui tetapi tetap , menggunakan estimator sebagai fungsi . Karena adalah fungsi dari variabel acak, perkirakanX1,…,Xn F θ g X 1 , ... , X n g g X1,…,Xn g
juga merupakan variabel acak. Kami mendefinisikan bias sebagai
estimator tidak bias ketika .Eθ(θ^n)=θ
Mengatakannya dalam bahasa Inggris sederhana: kita berurusan dengan variabel acak , jadi kecuali jika itu merosot , jika kita mengambil sampel yang berbeda, kita bisa berharap untuk mengamati data yang berbeda dan perkiraan yang berbeda pula. Meskipun demikian, kita bisa berharap bahwa di seluruh sampel yang berbeda "rata-rata" diperkirakan akan "benar" jika estimatornya tidak bias. Jadi itu tidak akan selalu benar, tetapi "rata-rata" itu akan benar. Ini tidak selalu selalu "benar" karena keacakan terkait dengan data.θ^n
Seperti yang telah dicatat oleh orang lain, fakta bahwa estimasi Anda menjadi "lebih dekat" dengan jumlah yang diperkirakan saat sampel Anda tumbuh, yaitu bahwa dalam konvergensi dalam probabilitas
berkaitan dengan konsistensi penduga , bukan ketidakberpihakan. Ketidakcocokan saja tidak memberi tahu kami apa pun tentang ukuran sampel dan hubungannya dengan perkiraan yang diperoleh. Selain itu, penaksir yang tidak bias tidak selalu tersedia dan tidak selalu lebih disukai daripada yang bias. Misalnya, setelah mempertimbangkan pengorbanan varians-ragam, Anda mungkin bersedia mempertimbangkan untuk menggunakan estimator dengan bias yang lebih besar, tetapi varians yang lebih kecil - jadi "rata-rata" akan lebih jauh dari nilai sebenarnya, tetapi lebih sering (varians lebih kecil) estimasi akan lebih dekat ke nilai sebenarnya, maka dalam hal penduga tidak bias.
sumber
Pertama, Anda harus membedakan bias kesalahpahaman dari bias statistik, terutama untuk orang awam.
Pilihan mengatakan menggunakan median, nilai tengah atau mode sebagai penaksir Anda untuk rata-rata populasi , sering kali berisi bias keyakinan politik, agama, atau sains. Perhitungan yang estimator adalah bentuk rata - rata terbaik adalah dari jenis yang berbeda dengan aritmatika yang mempengaruhi bias statistik.
Setelah Anda melewati bias pemilihan metode, maka Anda dapat mengatasi bias potensial dalam metode estimasi. Pertama, Anda harus memilih metode yang dapat memiliki bias, dan mekanisme yang mengarah dengan mudah ke arah bias itu.
Bisa lebih mudah menggunakan membagi sudut pandang penaklukan di mana menjadi jelas saat ukuran sampel semakin kecil, estimasi menjadi jelas bias. Misalnya faktor n-1 (vs 'n' faktor) dalam penduga penyebaran sampel menjadi jelas karena n turun dari 3 menjadi 2 menjadi 1!
Itu semua tergantung pada seberapa 'awam' orang tersebut.
sumber