Sepanjang kami menganggap statistik kami adalah fungsi dari beberapa data yang diambil dari fungsi distribusi ; fungsi distribusi empiris dari sampel kami adalah . Jadi adalah statistik yang dilihat sebagai variabel acak dan adalah versi statistik bootstrap. Kami menggunakan sebagai jarak KSF θ ( F ) θ ( F ) d ∞
Ada "jika dan hanya jika" hasil untuk validitas bootstrap jika statistik adalah statistik linier sederhana. Misalnya Teorema 1 dari Mammen "Kapan bootstrap bekerja?"
Jika untuk beberapa fungsi sewenang-wenang maka bootstrap berfungsi dalam arti bahwa
jika dan hanya jika ada dan sedemikian rupa sehinggaDi mana kita dapat mendefinisikan sebagai beberapa fungsi dari sampel kami dan
Ada juga hasil yang lebih umum bahwa bootstrap berfungsi untuk statistik umum, misalnya Teorema 1.6.3 dari Subsampling oleh Politis Romano dan Wolf:
Asumsikan diambil dari kelas semua distribusi dengan dukungan yang terbatas. Asumsikan statistik adalah Frechet dibedakan pada sehubungan dengan norma supremum dan turunannya memenuhi . Maka normal asimptotik dan bootstrap bekerja dalam arti teorema sebelumnya.
Saya ingin versi `jika dan hanya jika 'teorema kedua. Ini akan memerlukan gagasan kelancaran yang berbeda dari pembeda Frechet karena Politis, Romano dan Wolf (1999) menunjukkan bahwa median sampel tidak dapat dibedakan Frechet tetapi bootstrap masih berfungsi. Namun median sampel masih memiliki fungsi data yang lancar.
Ada beberapa komentar informal dalam Mammen bahwa kelancaran diperlukan:
Biasanya linearitas asimptotik lokal tampaknya diperlukan untuk konsistensi bootstrap
Kutipan adalah untuk:
van Zwet, W (1989). Bicara diberikan pada konferensi tentang "Metode asimptotik untuk prosedur intensif komputer dalam statistik" di Olberwolfach.
Tetapi saya tidak dapat menemukan jejak pembicaraan ini selain dari beberapa kutipan.
Jawaban:
Anda memerlukan diferensial diferensial Hadamard (atau diferensiabilitas kompak tergantung pada sumber referensi Anda) sebagai kondisi yang cukup untuk membuat bootstrap bekerja dalam kasus itu, median dan setiap kuantil adalah Hadamard dapat dibedakan. Diferensiasi frechet terlalu kuat di sebagian besar aplikasi.
Karena biasanya cukup untuk membahas ruang Polandia, di sana Anda ingin fungsional linier lokal untuk menerapkan argumen kekompakan tipikal untuk memperluas hasil konsistensi Anda pada situasi global. Lihat juga komentar linearisasi di bawah ini.
Teorema 2.27 dari [Wasserman] akan memberi Anda intuisi bagaimana turunan Hadamard adalah gagasan yang lebih lemah. Dan Teorema 3.6 dan 3.7 dari [Shao & Tu] akan memberikan kondisi yang cukup untuk konsistensi yang lemah dalam hal -Hadamard diferensiasi fungsi statistik dengan ukuran pengamatan .T n nρ Tn n
[Shao & Tu] hal.85-86 situasi yang diilustrasikan di mana inkonsistensi penduga bootstrap dapat terjadi.
Dan di Sec 3.5.2 dari [Shao & Tu] mereka ditinjau kembali contoh kuantil menggunakan smoothing kernel . Perhatikan bahwa momen adalah fungsional linier, kutipan dalam pertanyaan Anda "Biasanya linearitas asimptotik lokal tampaknya diperlukan untuk konsistensi bootstrap" memerlukan beberapa tingkat analitik fungsional, yang mungkin diperlukan karena jika gagal Anda dapat membuat beberapa kasus patologis seperti fungsi Weierstrass (yang kontinu namun tidak dapat dibedakan dari mana-mana).K
(3) Mengapa linearitas lokal tampaknya diperlukan dalam memastikan konsistensi estimator bootstrap?■
Adapun komentar "Biasanya linearitas asimptotik lokal tampaknya diperlukan untuk konsistensi bootstrap" yang dibuat oleh Mammen seperti yang Anda sebutkan. Sebuah komentar dari [Shao & Tu] hal.78 adalah sebagai berikut, ketika mereka berkomentar bahwa linierisasi (global) hanya merupakan teknik yang memfasilitasi bukti konsistensi dan tidak menunjukkan adanya kebutuhan:
Dan mereka memberikan contoh 3.3 untuk mendapatkan konsistensi bootstrap untuk jenis bootstrap MLE. Namun jika linearitas global efektif dengan cara itu, sulit membayangkan bagaimana seseorang akan membuktikan konsistensi tanpa linearitas lokal. Jadi kurasa itulah yang ingin dikatakan Mammen.
(4) Komentar lebih lanjut■
Di luar diskusi yang disediakan oleh [Shao & Tu] di atas, saya pikir yang Anda inginkan adalah kondisi karakterisasi konsistensi dari estimator bootstrap.
Saya benci untuk bersikap sinis namun saya masih merasa bahwa ini bukan satu-satunya penulisan statistik yang "mengutip dari kekosongan". Dengan mengatakan ini saya hanya merasa kutipan untuk pembicaraan van Zwet sangat tidak bertanggung jawab meskipun van Zwet adalah seorang sarjana yang hebat.
[Wasserman] Wasserman, Larry. Semua Statistik Nonparametrik, Springer, 2010.
[Shao & Tu] Shao, Jun, dan Dongsheng Tu. Jackknife dan bootstrap. Springer, 1995.
[Gine & Zinn] Giné, Evarist, dan Joel Zinn. "Bootstrap, tindakan empiris umum." The Annals of Probability (1990): 851-869.
[Huber] Huber, statistik Peter J. Robust. Wiley, 1985.
sumber