Apakah ada hasil yang memberikan bootstrap valid jika dan hanya jika statistiknya lancar?

25

Sepanjang kami menganggap statistik kami adalah fungsi dari beberapa data yang diambil dari fungsi distribusi ; fungsi distribusi empiris dari sampel kami adalah . Jadi adalah statistik yang dilihat sebagai variabel acak dan adalah versi statistik bootstrap. Kami menggunakan sebagai jarak KSθ()X1,XnF θ ( F ) θ ( F ) d FF^θ(F)θ(F^)d

Ada "jika dan hanya jika" hasil untuk validitas bootstrap jika statistik adalah statistik linier sederhana. Misalnya Teorema 1 dari Mammen "Kapan bootstrap bekerja?"

Jika θ(F)=1ni1nhn(Xi) untuk beberapa fungsi sewenang-wenang hn maka bootstrap berfungsi dalam arti bahwa

d[L(θ(F^)t^n),L(θ(F)tn)]p0
jika dan hanya jika ada σn dan tn sedemikian rupa sehingga
d[L(θ(F)tn),N(0,σn2)]p0
Di mana kita dapat mendefinisikan tn^ sebagai beberapa fungsi dari sampel kami dan tn=E(t^n)

Ada juga hasil yang lebih umum bahwa bootstrap berfungsi untuk statistik umum, misalnya Teorema 1.6.3 dari Subsampling oleh Politis Romano dan Wolf:

Asumsikan F diambil dari kelas semua distribusi dengan dukungan yang terbatas. Asumsikan statistik θ() adalah Frechet dibedakan pada F sehubungan dengan norma supremum dan turunannya gF memenuhi 0<VarF[gF(x)]< . Maka θ(F) normal asimptotik dan bootstrap bekerja dalam arti teorema sebelumnya.

Saya ingin versi `jika dan hanya jika 'teorema kedua. Ini akan memerlukan gagasan kelancaran yang berbeda dari pembeda Frechet karena Politis, Romano dan Wolf (1999) menunjukkan bahwa median sampel tidak dapat dibedakan Frechet tetapi bootstrap masih berfungsi. Namun median sampel masih memiliki fungsi data yang lancar.

Ada beberapa komentar informal dalam Mammen bahwa kelancaran diperlukan:

Biasanya linearitas asimptotik lokal tampaknya diperlukan untuk konsistensi bootstrap

Kutipan adalah untuk:

van Zwet, W (1989). Bicara diberikan pada konferensi tentang "Metode asimptotik untuk prosedur intensif komputer dalam statistik" di Olberwolfach.

Tetapi saya tidak dapat menemukan jejak pembicaraan ini selain dari beberapa kutipan.

orizon
sumber
1
Topik luar biasa. Apakah benar bahwa semua hasil yang dikutip adalah asimptotik untuk ukuran sampel hingga tak terbatas?
Michael M
3
@Michael Terima kasih dan ya, semuanya asimtotik seperti . Secara kebetulan ada beberapa karya terbaru dengan hasil untuk sampel terbatas (misalnya arxiv.org/pdf/1212.6906.pdf ) tetapi sangat teknis. n
orizon
1
Topik rumit. Beberapa mengatakan bootstrap tidak berfungsi secara umum. van Zwer et al. tidak mengatakan orang harus berhati-hati apa yang bootstraped . Saya pikir kita harus menetapkan apa yang harus bootstrap dan apa yang tidak untuk bootstrap terlebih dahulu sebelum pengujian lebih lanjut diperlukan.
Carl
Sekarang saya memperbarui jawabannya sebagai tanggapan atas komentar Mammen, harap itu menjelaskan lebih lanjut kebingungan Anda. Dan jika Anda mau, Anda bisa menjelaskan sedikit tentang aplikasi yang memotivasi Anda untuk bertanya tentang kebutuhan. Itu akan membantu saya meningkatkan jawaban saya.
Henry.L

Jawaban:

12

(1) Mengapa penaksir kuantil tidak dapat dibedakan dari Frechet tetapi penaksir bootstrapnya masih konsisten?

Anda memerlukan diferensial diferensial Hadamard (atau diferensiabilitas kompak tergantung pada sumber referensi Anda) sebagai kondisi yang cukup untuk membuat bootstrap bekerja dalam kasus itu, median dan setiap kuantil adalah Hadamard dapat dibedakan. Diferensiasi frechet terlalu kuat di sebagian besar aplikasi.

Karena biasanya cukup untuk membahas ruang Polandia, di sana Anda ingin fungsional linier lokal untuk menerapkan argumen kekompakan tipikal untuk memperluas hasil konsistensi Anda pada situasi global. Lihat juga komentar linearisasi di bawah ini.

Teorema 2.27 dari [Wasserman] akan memberi Anda intuisi bagaimana turunan Hadamard adalah gagasan yang lebih lemah. Dan Teorema 3.6 dan 3.7 dari [Shao & Tu] akan memberikan kondisi yang cukup untuk konsistensi yang lemah dalam hal -Hadamard diferensiasi fungsi statistik dengan ukuran pengamatan .T n nρTnn

(2) Apa yang akan mempengaruhi konsistensi estimator bootstrap?

[Shao & Tu] hal.85-86 situasi yang diilustrasikan di mana inkonsistensi penduga bootstrap dapat terjadi.

(1) bootstrap adalah sensitif terhadap perilaku ekor dari populasi . Konsistensi membutuhkan kondisi momen yang lebih ketat daripada yang diperlukan untuk keberadaan batas .H B O O T H 0FHBOOTH0

(2) Konsistensi penaksir bootstrap membutuhkan tingkat kelancaran tertentu dari statistik yang diberikan (fungsional) .Tn

(3) Perilaku estimator bootstrap terkadang tergantung pada metode yang digunakan untuk mendapatkan data bootstrap.

Dan di Sec 3.5.2 dari [Shao & Tu] mereka ditinjau kembali contoh kuantil menggunakan smoothing kernel . Perhatikan bahwa momen adalah fungsional linier, kutipan dalam pertanyaan Anda "Biasanya linearitas asimptotik lokal tampaknya diperlukan untuk konsistensi bootstrap" memerlukan beberapa tingkat analitik fungsional, yang mungkin diperlukan karena jika gagal Anda dapat membuat beberapa kasus patologis seperti fungsi Weierstrass (yang kontinu namun tidak dapat dibedakan dari mana-mana).K

(3) Mengapa linearitas lokal tampaknya diperlukan dalam memastikan konsistensi estimator bootstrap?

Adapun komentar "Biasanya linearitas asimptotik lokal tampaknya diperlukan untuk konsistensi bootstrap" yang dibuat oleh Mammen seperti yang Anda sebutkan. Sebuah komentar dari [Shao & Tu] hal.78 adalah sebagai berikut, ketika mereka berkomentar bahwa linierisasi (global) hanya merupakan teknik yang memfasilitasi bukti konsistensi dan tidak menunjukkan adanya kebutuhan:

Linearisasi adalah teknik penting lainnya dalam membuktikan konsistensi bootstrap estimator, karena hasil untuk statistik linier sering tersedia atau dapat ditetapkan dengan menggunakan teknik yang diperkenalkan sebelumnya. Misalkan statistik Tn yang diberikan dapat didekati dengan variabel acak linier (denganϕ(X)adalah statistik linier dalamX), yaitu (3.19)Tn=θ+Zn¯=1ni=1nϕ(Xn)ϕ(X)XMisalkanTn dan¯Z n menjadi analog bootstrapTndan¯Zn, masing-masing, berdasarkan pada sampel bootstrap{X1,,Xn}. Jika kita dapat menetapkan hasil untukTnmirip dengan (3.19), yaitu, (3.20)Tn=θ+¯

Tn=θ+Zn¯+oP(1n)
TnZn¯TnZn¯{X1,,Xn}Tnmaka batasHBOOT(x)(di manaxadalah nilai parameter)=P{
Tn=θ+Zn¯+oP(1n)
HBOOT(x)xsama denganP{=P{n(TnTn)x}.Kami telah sehingga mengurangi masalah untuk masalah yang melibatkan "sampel berarti" ¯ Z n , yang distribusi bootstrap estimator dapat ditunjukkan untuk konsisten menggunakan metode di Bagian 3.1 .2-3.1.4.P{n(Zn¯Zn¯)x}Zn¯

Dan mereka memberikan contoh 3.3 untuk mendapatkan konsistensi bootstrap untuk jenis bootstrap MLE. Namun jika linearitas global efektif dengan cara itu, sulit membayangkan bagaimana seseorang akan membuktikan konsistensi tanpa linearitas lokal. Jadi kurasa itulah yang ingin dikatakan Mammen.

(4) Komentar lebih lanjut

Di luar diskusi yang disediakan oleh [Shao & Tu] di atas, saya pikir yang Anda inginkan adalah kondisi karakterisasi konsistensi dari estimator bootstrap.

M(X)TCLT

M(X)

Saya benci untuk bersikap sinis namun saya masih merasa bahwa ini bukan satu-satunya penulisan statistik yang "mengutip dari kekosongan". Dengan mengatakan ini saya hanya merasa kutipan untuk pembicaraan van Zwet sangat tidak bertanggung jawab meskipun van Zwet adalah seorang sarjana yang hebat.

[Wasserman] Wasserman, Larry. Semua Statistik Nonparametrik, Springer, 2010.

[Shao & Tu] Shao, Jun, dan Dongsheng Tu. Jackknife dan bootstrap. Springer, 1995.

[Gine & Zinn] Giné, Evarist, dan Joel Zinn. "Bootstrap, tindakan empiris umum." The Annals of Probability (1990): 851-869.

[Huber] Huber, statistik Peter J. Robust. Wiley, 1985.

Henry
sumber