Menentukan ukuran sampel yang diperlukan untuk metode bootstrap / Metode yang Diusulkan

33

Saya tahu ini adalah topik yang agak panas di mana tidak ada yang benar-benar dapat memberikan jawaban sederhana. Namun demikian saya bertanya-tanya apakah pendekatan berikut ini tidak bisa bermanfaat.

Metode bootstrap hanya berguna jika sampel Anda mengikuti kurang lebih (baca persis) distribusi yang sama dengan populasi asli. Untuk memastikan hal ini, Anda perlu membuat ukuran sampel Anda cukup besar. Tapi apa yang cukup besar?

Jika premis saya benar, Anda memiliki masalah yang sama ketika menggunakan teorema batas pusat untuk menentukan rata-rata populasi. Hanya ketika ukuran sampel Anda cukup besar Anda dapat yakin bahwa populasi rata-rata sampel Anda terdistribusi secara normal (sekitar mean populasi). Dengan kata lain, sampel Anda harus mewakili populasi Anda (distribusi) dengan cukup baik. Tetapi sekali lagi, apa yang cukup besar?

Dalam kasus saya (proses administrasi: waktu yang dibutuhkan untuk menyelesaikan permintaan vs jumlah permintaan) Saya memiliki populasi dengan distribusi multi-modal (semua permintaan yang selesai pada tahun 2011) di mana saya 99% yakin bahwa itu bahkan kurang terdistribusi normal daripada populasi (semua tuntutan yang selesai antara hari ini dan hari di masa lalu, idealnya rentang waktu ini sekecil mungkin) Saya ingin meneliti.

Populasi 2011 saya ada di luar unit yang cukup untuk membuat sampel dengan ukuran sampel n . Saya memilih nilai x , misalkan 10 ( x = 10 ). Sekarang saya menggunakan trial and error untuk menentukan ukuran sampel yang baik. Saya mengambil n = 50 , dan melihat apakah populasi rata-rata sampel saya terdistribusi secara normal dengan menggunakan Kolmogorov-Smirnov. Jika demikian saya ulangi langkah yang sama tetapi dengan ukuran sampel 40 , jika tidak ulangi dengan ukuran sampel 60 (dll.).xnx10x=10n=504060

Setelah beberapa saat saya menyimpulkan bahwa adalah ukuran sampel minimum absolut untuk mendapatkan representasi yang kurang lebih baik dari populasi 2011 saya. Karena saya tahu populasi yang saya minati (semua permintaan yang selesai antara hari ini dan satu hari di masa lalu) memiliki varian yang lebih sedikit, saya dapat dengan aman menggunakan ukuran sampel n = 45 untuk bootstrap. (Secara tidak langsung, n = 45 menentukan ukuran rentang waktu saya: waktu yang dibutuhkan untuk menyelesaikan 45 permintaan.)n=45n=45n=4545

x10

Menanggapi jawaban pertama Terima kasih telah membalas, Jawaban Anda sangat berguna bagi saya terutama tautan buku.
Tetapi saya khawatir bahwa dalam upaya saya untuk memberikan informasi, saya sepenuhnya mengaburkan pertanyaan saya. Saya tahu bahwa sampel bootstrap mengambil alih distribusi sampel populasi. Saya mengikuti Anda sepenuhnya tetapi ...

Sampel populasi asli Anda harus cukup besar untuk cukup yakin bahwa distribusi sampel populasi Anda sesuai (sama) dengan distribusi populasi 'nyata'.

Ini hanyalah sebuah gagasan tentang bagaimana menentukan seberapa besar ukuran sampel asli Anda perlu agar cukup yakin bahwa distribusi sampel sesuai dengan distribusi populasi.

Misalkan Anda memiliki distribusi populasi bimodal dan satu top jauh lebih besar dari yang lainnya. Jika ukuran sampel Anda 5, kemungkinan besar bahwa semua 5 unit memiliki nilai yang sangat dekat dengan bagian atas besar (peluang untuk secara acak menggambar unit ada yang terbesar). Dalam hal ini distribusi sampel Anda akan terlihat monomodal.

Dengan ukuran sampel seratus kemungkinan distribusi sampel Anda juga bimodal jauh lebih besar !! Masalah dengan bootstrap adalah bahwa Anda hanya memiliki satu sampel (dan Anda membangun lebih jauh pada sampel itu). Jika distribusi sampel benar-benar tidak sesuai dengan distribusi populasi Anda berada dalam masalah. Ini hanya sebuah ide untuk membuat peluang memiliki 'distribusi sampel yang buruk' serendah mungkin tanpa harus membuat ukuran sampel Anda sangat besar.

Siegfried
sumber

Jawaban:

38

Saya tertarik pada pertanyaan ini karena saya melihat kata bootstrap dan saya telah menulis buku di bootstrap. Juga orang-orang sering bertanya "Berapa banyak sampel bootstrap yang saya perlukan untuk mendapatkan perkiraan Monte Carlo yang bagus untuk hasil bootstrap?" Jawaban saya yang disarankan untuk pertanyaan itu adalah untuk terus meningkatkan ukuran sampai Anda mendapatkan konvergensi. Tidak ada satu nomor yang cocok untuk semua masalah.

nnndari sampel asli. Apakah prinsip bootstrap berlaku atau tidak, tidak bergantung pada sampel individual "yang mewakili populasi". Apa yang ia lakukan bergantung pada apa yang Anda perkirakan dan beberapa properti distribusi populasi (misalnya, ini berfungsi untuk pengambilan sampel berarti dengan distribusi populasi yang memiliki varian terbatas, tetapi tidak ketika mereka memiliki varian tak terbatas). Ini tidak akan berfungsi untuk memperkirakan ekstrem terlepas dari distribusi populasi.

Teori bootstrap melibatkan menunjukkan konsistensi estimasi. Jadi dapat ditunjukkan secara teori bahwa itu bekerja untuk sampel besar. Tapi itu juga bisa bekerja dalam sampel kecil. Saya telah melihatnya bekerja untuk estimasi tingkat kesalahan klasifikasi terutama dalam ukuran sampel kecil seperti 20 untuk data bivariat.

Sekarang jika ukuran sampel sangat kecil --- katakanlah 4 --- bootstrap mungkin tidak berfungsi hanya karena set sampel bootstrap yang mungkin tidak cukup kaya. Dalam buku saya atau buku Peter Hall masalah ini terlalu kecil ukuran sampel dibahas. Tetapi jumlah sampel bootstrap yang berbeda ini menjadi besar dengan sangat cepat. Jadi ini bukan masalah bahkan untuk ukuran sampel sekecil 8. Anda dapat melihat referensi ini:

Michael R. Chernick
sumber
3
Apakah ada tes standar untuk dijalankan untuk memeriksa apakah ada (misalnya 4 sampel) tidak cukup? Saya memiliki dataset di mana saya menghitung interval kepercayaan bootstrap untuk rata-rata, tetapi beberapa individu memiliki sangat sedikit titik data (<8 dalam beberapa kasus). Naluri saya memberi tahu saya bahwa saya harus mengabaikan individu yang memiliki kurang dari n poin data, tetapi kemudian bagaimana saya mendefinisikan cuttoff n ini? Saya berharap untuk menemukan nilai cutoff yang diterima secara umum (analog dengan bagaimana 6 atau 7 adalah titik cut-off sewenang-wenang untuk jumlah sampel per kelompok dalam analisis model campuran).
RTbecard