Saya mengalami kesulitan untuk memahami cara menggunakan bootstrap untuk menghitung interval prediksi untuk model regresi linier. Adakah yang bisa menjelaskan prosedur langkah demi langkah? Saya mencari melalui Google tetapi tidak ada yang benar-benar masuk akal bagi saya.
Saya mengerti bagaimana menggunakan bootstrap untuk menghitung interval kepercayaan untuk parameter model.
Jawaban:
Interval kepercayaan memperhitungkan ketidakpastian estimasi. Interval prediksi menambah ketidakpastian mendasar ini. R's
predict.lm
akan memberi Anda interval prediksi untuk model linier. Dari sana, yang harus Anda lakukan adalah menjalankannya berulang kali pada sampel bootstrap.Hasilnya
replicate
adalah array 3 dimensi (n
x3
xn.bs
). Dimensi panjang 3 terdiri dari nilai pas untuk setiap elemen data, dan batas bawah / atas dari interval prediksi 95%.Metode Gary King
Tergantung pada apa yang Anda inginkan, ada metode keren oleh King, Tomz, dan Wittenberg . Ini relatif mudah diterapkan, dan menghindari masalah bootstrap untuk perkiraan tertentu (misalnya
max(Y)
).Saya akan mengutip dari definisinya tentang ketidakpastian mendasar di sini, karena ini cukup bagus:
sumber
Bootstrap tidak mengasumsikan pengetahuan tentang bentuk distribusi induk yang mendasari dari mana sampel muncul. Estimasi parameter statistik klasik tradisional didasarkan pada asumsi normalitas. Bootstrap berurusan dengan non-normalitas dan lebih akurat dalam praktik daripada metode klasik.
Bootstrapping menggantikan daya komputasi mentah komputer untuk analisis teoretis yang ketat. Ini adalah perkiraan untuk distribusi sampling dari istilah kesalahan kumpulan data. Bootstrap meliputi: pengambilan sampel kembali data yang ditetapkan beberapa kali, menghitung rata-rata dari setiap sampel dan menemukan kesalahan standar rata-rata.
Kode "R" berikut menunjukkan konsep:
Contoh praktis ini menunjukkan manfaat bootstrap dan memperkirakan kesalahan standar. Kesalahan standar diperlukan untuk menghitung interval kepercayaan.
Biarkan kami menganggap Anda memiliki set data miring "a":
visualisasi dari kumpulan data yang miring
Lakukan prosedur bootstrap:
sumber