Bekerja dengan sampel bootstrap vs sampel asli

Pertimbangkan contoh bilangan real. Katakanlah kita ingin memperkirakan kecenderungan sentral populasi dan memahami ketidakpastian kita tentang estimasi ini.

Mari kita singkirkan asumsi tentang distribusi populasi sejenak, dan pertimbangkan dua pendekatan berikut.

Dapatkan sampel bootstrap dari sampel input. Yaitu, sampel dengan penggantian (mis. Dapatkan 100 sampel ulang) dan hitung rata-rata untuk setiap sampel ulang. Kami kemudian menampilkan interval rata-rata dan kepercayaan pada distribusi empiris yang dihasilkan dari rata-rata.
Kami mengeluarkan rata-rata dari sampel input, dan persentil di sekitar rata-rata untuk menyampaikan ketidakpastian di sekitar taksiran.

Bootstrap vs sampel asli:

Sementara saya mengerti apa yang dilakukan pendekatan # 1. Apakah ada estimator yang mendasari di belakang # 2?
Apa yang akan persentil di sekitar mean di # 2 berbeda dengan CI dari # 1? Pendekatan # 2 menyampaikan rasa ketidakpastian, tetapi saya mengalami kesulitan menghubungkannya dengan interpretasi yang sering atau Bayesian.
Apakah metode # 2 akan memberikan penduga yang lebih baik dari rata-rata populasi? (mis. varian kurang bias dan lebih rendah)?

estimation bootstrap Amelio Vazquez-Reina
sumber

Jawaban:

Estimator dalam # 2 adalah hal yang Anda hasilkan interval untuk ... mean sampel. Anda menggunakan bootstrap untuk mencoba mendapatkan distribusi sampling dari mean sampel, dengan menggunakan distribusi resampling untuk memperkirakannya.

Karena itu adalah penaksir yang sama persis di # 1 dan # 2, # 2 akan memiliki sifat benar yang sama (apa pun itu, karena Anda tidak benar-benar mengetahui distribusi yang benar, tingkat ketergantungan yang benar, dan sebagainya) seperti pada # 1, Anda hanya mencoba mendapatkan salah satu dari properti itu dengan dua cara berbeda.

Glen_b -Reinstate Monica
sumber