Pertimbangkan contoh bilangan real. Katakanlah kita ingin memperkirakan kecenderungan sentral populasi dan memahami ketidakpastian kita tentang estimasi ini.
Mari kita singkirkan asumsi tentang distribusi populasi sejenak, dan pertimbangkan dua pendekatan berikut.
- Dapatkan sampel bootstrap dari sampel input. Yaitu, sampel dengan penggantian (mis. Dapatkan 100 sampel ulang) dan hitung rata-rata untuk setiap sampel ulang. Kami kemudian menampilkan interval rata-rata dan kepercayaan pada distribusi empiris yang dihasilkan dari rata-rata.
- Kami mengeluarkan rata-rata dari sampel input, dan persentil di sekitar rata-rata untuk menyampaikan ketidakpastian di sekitar taksiran.
Bootstrap vs sampel asli:
- Sementara saya mengerti apa yang dilakukan pendekatan # 1. Apakah ada estimator yang mendasari di belakang # 2?
- Apa yang akan persentil di sekitar mean di # 2 berbeda dengan CI dari # 1? Pendekatan # 2 menyampaikan rasa ketidakpastian, tetapi saya mengalami kesulitan menghubungkannya dengan interpretasi yang sering atau Bayesian.
- Apakah metode # 2 akan memberikan penduga yang lebih baik dari rata-rata populasi? (mis. varian kurang bias dan lebih rendah)?
sumber