Saat membaca tentang cara memperkirakan distribusi sampel, berarti saya menemukan metode bootstrap nonparametrik. Rupanya orang dapat memperkirakan distribusi dengan distribusi , di mana menunjukkan rata-rata sampel dari sampel bootstrap.
Pertanyaan saya kemudian adalah: Apakah saya perlu pemusatan? Untuk apa?
Tidak bisakah saya memperkirakan oleh ? P ( ˉ X ∗ n ≤ x )
distributions
bootstrap
resampling
centering
Christin
sumber
sumber
Jawaban:
Ya, Anda dapat memperkirakan dengan P ( ˉ X ∗ n ≤ x ) tetapi tidak optimal. Ini adalah bentuk bootstrap persentil. Namun, bootstrap persentil tidak berkinerja baik jika Anda ingin membuat kesimpulan tentang rata-rata populasi kecuali Anda memiliki ukuran sampel yang besar. (Itu memang bekerja dengan baik dengan banyak masalah inferensi lain termasuk ketika ukuran sampel kecil.) Saya mengambil kesimpulan ini dari Statistik Modern Wilcox untuk Ilmu Sosial dan Perilaku , CRC Press, 2012. Sebuah bukti teoretis berada di luar saya. Saya khawatir .P ( X¯n≤ x ) P ( X¯∗n≤ x )
Varian pada pendekatan pemusatan maju ke langkah berikutnya dan skala statistik bootstrap terpusat Anda dengan sampel standar deviasi dan ukuran sampel, menghitung dengan cara yang sama seperti pada statistik. Kuantil dari distribusi statistik t ini dapat digunakan untuk membangun interval kepercayaan atau melakukan tes hipotesis. Ini adalah metode bootstrap-t dan memberikan hasil yang unggul ketika membuat kesimpulan tentang rata-rata.
Mari kita menjadi re-sampel standar deviasi berdasarkan pada bootstrap re-sampel, menggunakan n-1 sebagai denominator; dan menjadi standar deviasi dari sampel asli. Membiarkans∗
Persentil ke-97,5 dan 2,5 dari distribusi simulasi dapat membuat interval kepercayaan untuk μ dengan:T∗ μ
Pertimbangkan hasil simulasi di bawah ini, yang menunjukkan bahwa dengan distribusi campuran yang kurang miring interval kepercayaan dari metode ini mengandung nilai sebenarnya lebih sering daripada metode bootstrap persentil atau inversi tradisional pada statistik tanpa bootstrap.
Ini memberikan berikut (conf.t adalah metode bootstrap t; conf.p adalah metode bootstrap persentil).
Dengan satu contoh dari distribusi miring:
Ini memberikan yang berikut. Perhatikan bahwa "conf.t" - versi t bootstrap - memberikan interval kepercayaan yang lebih luas daripada dua lainnya. Pada dasarnya, lebih baik menanggapi distribusi populasi yang tidak biasa.
Akhirnya di sini ada seribu simulasi untuk melihat versi mana yang memberikan interval kepercayaan yang paling sering benar:
Ini memberikan hasil di bawah ini - jumlahnya adalah kali dari 1.000 sehingga interval kepercayaan berisi nilai sebenarnya dari populasi yang disimulasikan. Perhatikan bahwa tingkat keberhasilan sebenarnya dari setiap versi sangat kurang dari 95%.
sumber