Saat ini saya sedang membaca "Semua Statistik" karya Larry Wasserman dan bingung dengan sesuatu yang ditulisnya dalam bab tentang memperkirakan fungsi statistik model nonparametrik.
Dia menulis
"Kadang-kadang kita dapat menemukan kesalahan standar estimasi fungsi statistik dengan melakukan beberapa perhitungan. Namun dalam kasus lain tidak jelas bagaimana memperkirakan kesalahan standar".
Saya ingin menunjukkan bahwa pada bab berikutnya dia berbicara tentang bootstrap untuk mengatasi masalah ini, tetapi karena saya tidak benar-benar memahami pernyataan ini, saya tidak sepenuhnya mendapatkan insentif di balik Bootstrap?
Contoh apa yang ada ketika tidak jelas bagaimana memperkirakan kesalahan standar?
Semua contoh saya telah melihat sejauh ini telah "jelas" seperti kemudian
Jawaban:
Dua jawaban.
sumber
Contoh mungkin membantu untuk menggambarkan. Misalkan, dalam kerangka pemodelan kausal, Anda tertarik dalam menentukan apakah hubungan antara (eksposur bunga) merupakan Y (hasil dari bunga) dimediasi oleh variabel W . Ini berarti bahwa dalam dua model regresi:X Y W
Efek berbeda dari efek γ 1 .β1 γ1
Sebagai contoh, pertimbangkan hubungan antara merokok dan risiko kardiovaskular (CV). Merokok jelas meningkatkan risiko CV (untuk kejadian seperti serangan jantung dan stroke) dengan menyebabkan pembuluh darah menjadi rapuh dan terkalsifikasi. Namun, merokok juga merupakan penekan nafsu makan. Jadi kita akan ingin tahu apakah perkiraan hubungan antara merokok dan risiko CV dimediasi oleh BMI, yang secara independen merupakan faktor risiko untuk risiko CV. Di sini bisa menjadi peristiwa biner (infark miokard atau neurologis) dalam model regresi logistik atau variabel kontinu seperti kalsifikasi arteri koroner (CAC), fraksi ejeksi ventrikel kiri (LVEF), atau massa ventrikel kiri (LVM).Y
Kami akan cocok dengan dua model 1: menyesuaikan untuk merokok dan hasilnya bersama dengan perancu lain seperti usia, jenis kelamin, pendapatan, dan riwayat keluarga penyakit jantung kemudian 2: semua kovariat sebelumnya serta indeks massa tubuh. Perbedaan dalam efek merokok antara model 1 dan 2 adalah di mana kita mendasarkan kesimpulan kita.
Kami tertarik untuk menguji hipotesis
Satu kemungkinan efek pengukuran dapat berupa: atau S = β 1 / γ 1 atau sejumlah pengukuran. Anda dapat menggunakan estimator biasa untuk T dan S . Kesalahan standar dari estimator ini sangat rumit untuk diturunkan. Bootstrap distribusi mereka, bagaimanapun, adalah teknik yang umum diterapkan, dan mudah untuk menghitung nilai- p langsung dari itu.T=β1−γ1 S=β1/γ1 T S p
sumber
Memiliki solusi parametrik untuk setiap ukuran statistik akan diinginkan tetapi, pada saat yang sama, sangat tidak realistis. Bootstrap sangat berguna dalam hal-hal tersebut. Contoh yang muncul di benak saya menyangkut perbedaan antara dua cara distribusi biaya yang sangat miring. Dalam hal itu, uji-t dua sampel klasik gagal memenuhi persyaratan teoretisnya (distribusi dari mana sampel yang diselidiki ditarik keluar dari normalitas, karena ekor kanannya yang panjang) dan uji non-parametrik kurang mampu menyampaikan informasi berguna untuk pembuat keputusan (yang biasanya tidak tertarik pada peringkat). Solusi yang mungkin untuk menghindari macet pada masalah itu adalah uji-bootstrap dua sampel.
sumber