Katakanlah saya telah mengumpulkan sejumlah kecil (N) pengamatan untuk hipotesis yang ingin saya uji. Saya bisa menggunakan metode bootstrap untuk menghasilkan distribusi sampel untuk hasil rata-rata dari pengamatan N, tapi saya khawatir bahwa model ini bisa rusak ketika N menjadi sangat kecil, memperkenalkan kesalahan ke dalam distribusi sampel itu sendiri.
Jadi pertanyaan saya adalah, bagaimana saya bisa menentukan N minimum yang saya butuhkan untuk hasil yang masuk akal; atau lebih secara kuantitatif, bagaimana N terkait dengan kesalahan pengambilan sampel sebagai N-> 0?
Pembaruan: Saya mulai memahami bahwa nilai minimum untuk N akan bervariasi berdasarkan sifat data yang mendasarinya. Jadi, dalam hal ini meta-observasi apa yang dapat saya lakukan untuk membantu saya menentukan ini? Saya tidak tahu distribusi mendasar yang sebenarnya, atau saya tidak perlu bootstrap.
Jawaban:
Tidak ada jawaban langsung untuk ini, karena akan selalu tergantung pada distribusi data Anda yang sebenarnya (bayangkan kasus degenerasi di mana satu-satunya nilai yang diizinkan adalah 1: maka bootstrap dari sampel ukuran 1 akan sama baiknya dengan apa pun !) dan statistik yang akan Anda hitung: beberapa statistik akan lebih sulit pulih dari ukuran sampel yang kecil daripada yang lain (bayangkan sebuah contoh dari pencilan ekstrim).
Jadi: Anda harus lebih spesifik daripada apa yang telah Anda berikan kepada kami sejauh ini.
sumber