Katakanlah saya memiliki sampel dan sampel bootstrap dari sampel ini untuk stastitik (misalnya rata-rata). Seperti yang kita semua tahu, sampel bootstrap ini memperkirakan pada distribusi sampling dari penaksir statistik.
Sekarang, apakah rata-rata sampel bootstrap ini merupakan estimasi yang lebih baik dari statistik populasi daripada statistik sampel asli ? Dalam kondisi apa itu akan terjadi?
estimation
bootstrap
Amelio Vazquez-Reina
sumber
sumber
Jawaban:
Mari kita menggeneralisasi, sehingga fokus pada inti masalah. Saya akan menguraikan detail terkecil sehingga tidak meninggalkan keraguan. Analisis hanya memerlukan yang berikut ini:
The mean aritmetik dari himpunan bilangan didefinisikan sebagaiz1,…,zm
Ekspektasi adalah operator linier. Yaitu, ketika adalah variabel acak dan α i adalah angka, maka ekspektasi dari kombinasi linear adalah kombinasi linear dari ekspektasi,Zi,i=1,…,m αi
Biarkan menjadi sampel ( B 1 , ... , B k ) yang diperoleh dari dataset x = ( x 1 , ... , x n ) dengan mengambil elemen k secara seragam dari x dengan penggantian. Mari m ( B ) menjadi mean aritmetik dari B . Ini adalah variabel acak. KemudianB (B1,…,Bk) x=(x1,…,xn) k x m(B) B
diikuti oleh linearitas harapan. Karena unsur-unsur semuanya diperoleh dengan cara yang sama, mereka semua memiliki harapan yang sama, b katakan:B b
Ini menyederhanakan hal sebelumnya
Menurut definisi, ekspektasi adalah jumlah nilai tertimbang-probabilitas. Karena setiap nilai diasumsikan memiliki peluang yang sama dengan 1 / n dipilih,X 1/n
rata-rata aritmatika data.
Untuk statistik yang bukan fungsi linier data, hasil yang sama tidak selalu berlaku. Namun, itu akan salah hanya dengan mengganti rata-rata bootstrap untuk nilai statistik pada data: itu bukan cara kerja bootstrap. Sebagai gantinya, dengan membandingkan rata-rata bootstrap dengan statistik data, kami memperoleh informasi tentang bias statistik. Ini dapat digunakan untuk menyesuaikan statistik asli untuk menghapus bias. Karenanya, estimasi yang dikoreksi bias menjadi kombinasi aljabar dari statistik asli dan rata-rata bootstrap. Untuk informasi lebih lanjut, lihat "BCa" (bootstrap yang dikoreksi dan dipercepat) dan "ABC". Wikipedia menyediakan beberapa referensi.
sumber
Karena distribusi bootstrap didefinisikan sebagai
sumber