Saya bertanya-tanya bagaimana CI bootstrap (dan BCa di barticular) melakukan pada data yang terdistribusi normal. Tampaknya ada banyak pekerjaan yang memeriksa kinerja mereka pada berbagai jenis distribusi, tetapi tidak dapat menemukan apa pun pada data yang didistribusikan secara normal. Karena tampaknya hal yang jelas untuk dipelajari pertama kali, saya kira kertas-kertas itu terlalu tua.
Saya melakukan beberapa simulasi Monte Carlo menggunakan paket boot R dan menemukan bootstrap CI sesuai dengan CI yang tepat, meskipun untuk sampel kecil (N <20) mereka cenderung sedikit liberal (CI lebih kecil). Untuk sampel yang cukup besar, mereka pada dasarnya sama.
Ini membuat saya bertanya-tanya apakah ada alasan bagus untuk tidak selalu menggunakan bootstrap. Mengingat sulitnya menilai apakah suatu distribusi itu normal, dan banyak jebakan di balik ini, tampaknya masuk akal untuk tidak memutuskan dan melaporkan bootstrap CI terlepas dari distribusinya. Saya memahami motivasi untuk tidak menggunakan tes non-parametrik secara sistematis, karena mereka memiliki daya yang lebih kecil, tetapi simulasi saya mengatakan kepada saya ini bukan kasus untuk bootstrap CI. Mereka bahkan lebih kecil.
Pertanyaan serupa yang menggangguku adalah mengapa tidak selalu menggunakan median sebagai ukuran tendensi sentral. Orang sering merekomendasikan untuk menggunakannya untuk mengkarakterisasi data yang tidak terdistribusi normal, tetapi karena mediannya sama dengan rata-rata untuk data yang terdistribusi normal, mengapa membuat perbedaan? Tampaknya cukup menguntungkan jika kita dapat menghilangkan prosedur untuk memutuskan apakah suatu distribusi normal atau tidak.
Saya sangat ingin tahu tentang pemikiran Anda tentang masalah ini, dan apakah mereka telah dibahas sebelumnya. Referensi akan sangat dihargai.
Terima kasih!
Pierre
Jawaban:
Adalah bermanfaat untuk melihat motivasi untuk interval BCa dan mekanismenya (yaitu yang disebut "faktor koreksi"). Interval BCa adalah salah satu aspek terpenting dari bootstrap karena mereka adalah kasus yang lebih umum dari Interval Bootstrap Persentil (yaitu interval kepercayaan hanya berdasarkan distribusi bootstrap itu sendiri).
Secara khusus, lihat hubungan antara interval BCa dan Interval Persentase Bootstrap: ketika penyesuaian untuk akselerasi ("faktor koreksi" pertama) dan kemiringan ("faktor koreksi" kedua) sama-sama nol, maka interval BCa kembali ke Interval Persentil Bootstrap yang khas.
Saya tidak berpikir itu akan menjadi ide yang bagus untuk SELALU menggunakan bootstrap. Bootstrap adalah teknik yang kuat yang memiliki berbagai mekanisme (mis: interval kepercayaan dan ada variasi bootstrap yang berbeda untuk berbagai jenis masalah seperti bootstrap liar ketika ada heteroskedastisitas) untuk menyesuaikan masalah yang berbeda (mis: non-normalitas) ), tetapi ini bergantung pada satu asumsi penting: data secara akurat mewakili populasi yang sebenarnya.
Asumsi ini, meskipun sederhana di alam, bisa sulit untuk diverifikasi terutama dalam konteks ukuran sampel kecil (bisa jadi bahwa sampel kecil adalah cerminan akurat dari populasi yang sebenarnya!). Jika sampel asli tempat distribusi bootstrap (dan karenanya semua hasil yang mengikuti darinya) tidak cukup akurat, maka hasil Anda (dan karenanya keputusan Anda berdasarkan hasil tersebut) akan cacat.
KESIMPULAN: Ada banyak ambiguitas dengan bootstrap dan Anda harus berhati-hati sebelum menerapkannya.
sumber