Saya pikir, saya sudah mengerti definisi matematika dari penduga yang konsisten. Koreksi saya jika saya salah:
adalah estimator yang konsisten untuk jika
Di mana, adalah Parametric Space. Tetapi saya ingin memahami perlunya penaksir untuk konsisten. Mengapa estimator yang tidak konsisten buruk? Bisakah Anda memberi saya beberapa contoh?
Saya menerima simulasi dalam R atau python.
estimation
consistency
Keluarga
sumber
sumber
Jawaban:
Jika estimator tidak konsisten, itu tidak akan konvergen ke nilai sebenarnya dalam probabilitas . Dengan kata lain, selalu ada kemungkinan bahwa penaksir dan nilai sebenarnya Anda akan memiliki perbedaan, tidak peduli berapa banyak poin data yang Anda miliki. Ini sebenarnya buruk, karena bahkan jika Anda mengumpulkan sejumlah besar data, perkiraan Anda akan selalu memiliki probabilitas positif menjadi beberapaϵ>0 berbeda dari nilai sebenarnya. Secara praktis, Anda dapat mempertimbangkan situasi ini seolah-olah Anda menggunakan penduga jumlah yang bahkan mensurvei semua populasi, bukannya sampel kecil, tidak akan membantu Anda.
sumber
Pertimbangkann=10000 pengamatan dari distribusi Cauchy standar, yang sama dengan distribusi t Student dengan 1 derajat kebebasan. Ekor dari distribusi ini cukup berat sehingga tidak berarti; distribusi dipusatkan pada mediannyaη=0.
Urutan sampel berartiAj=1j∑ji=1Xi tidak konsisten untuk pusat distribusi Cauchy. Secara kasar, kesulitannya adalah bahwa pengamatan yang sangat ekstrimXi (positif atau negatif) terjadi dengan keteraturan yang cukup sehingga tidak ada peluang bagiAj untuk konvergen menjadiη=0. (Aj tidak hanya lambat untuk konvergen, mereka tidak ' tidak pernah konvergen. DistribusiAj lagi standar Cauchy [bukti].)
Sebaliknya, setiap satu langkah dalam proses pengambilan sampel melanjutkan, sekitar setengah dari pengamatanXi akan berbaring di kedua sisi η, sehingga urutan Hj dari median sampel tidak konvergen ke η.
Kurangnya konvergensiAj dan konvergensi Hj diilustrasikan oleh simulasi berikut.
Berikut adalah daftar langkah-langkah di mana|Xi|>1000. Anda dapat melihat efek dari beberapa pengamatan ekstrem ini terhadap rata-rata berlari di plot di sebelah kiri (di garis putus-putus merah vertikal).
Konsistensi dalam estimasi penting: Dalam pengambilan sampel dari populasi Cauchy, rata-rata sampel dari sampeln=10000 pengamatan tidak lebih baik untuk memperkirakan pusatη dari hanya satu pengamatan. Sebaliknya, median sampel konsisten konvergen keη, sehingga sampel yang lebih besar menghasilkan perkiraan yang lebih baik.
sumber
Contoh yang sangat sederhana tentang mengapa penting untuk memikirkan konsistensi, yang menurut saya tidak mendapatkan perhatian yang cukup, adalah model yang terlalu disederhanakan.
Sebagai contoh teoretis, anggaplah Anda ingin menyesuaikan model regresi linier pada beberapa data, di mana efek sebenarnya sebenarnya non-linear. Maka prediksi Anda tidak dapat konsisten untuk mean sebenarnya untuk semua kombinasi kovariat, sementara yang lebih fleksibel mungkin bisa. Dengan kata lain, model yang disederhanakan akan memiliki kekurangan yang tidak dapat diatasi dengan menggunakan lebih banyak data.
sumber
@BruceET telah memberikan jawaban teknis yang sangat baik, tetapi saya ingin menambahkan poin tentang interpretasi dari semuanya.
Salah satu konsep dasar dalam statistik adalah bahwa dengan bertambahnya ukuran sampel, kami dapat mencapai kesimpulan yang lebih tepat tentang distribusi yang mendasarinya. Anda bisa menganggapnya sebagai gagasan bahwa mengambil banyak sampel menghilangkan jitter acak dalam data, jadi kami mendapatkan gagasan yang lebih baik tentang struktur yang mendasarinya.
Sekarang, meminta penaksir untuk konsisten adalah menuntut bahwa ia juga mengikuti aturan ini: Karena tugasnya adalah memperkirakan parameter yang tidak diketahui, kami ingin konvergen ke parameter itu (baca: memperkirakan parameter itu dengan sewenang-wenang) sebagai sampel kami ukuran cenderung tak terbatas.
Persamaannya
sumber