Apakah ada nama untuk jenis bootstrap ini?

9

Pertimbangkan percobaan dengan beberapa partisipan manusia, masing-masing diukur beberapa kali dalam dua kondisi. Model efek campuran dapat dirumuskan (menggunakan sintaks lme4 ) sebagai:

fit = lmer(
    formula = measure ~ (1|participant) + condition
)

Sekarang, katakan saya ingin membuat interval kepercayaan bootstrap untuk prediksi model ini. Saya pikir saya telah datang dengan metode yang sederhana dan efisien secara komputasi, dan saya yakin saya bukan yang pertama memikirkannya, tetapi saya mengalami kesulitan menemukan publikasi sebelumnya yang menjelaskan pendekatan ini. Ini dia:

  1. Sesuai model (seperti di atas), sebut ini "model asli"
  2. Dapatkan prediksi dari model asli, sebut ini "prediksi asli"
  3. Dapatkan residu dari model asli yang terkait dengan setiap respons dari masing-masing peserta
  4. Sampel ulang residu, sampel peserta dengan penggantian
  5. Paskan model efek campuran linier dengan kesalahan gaussian ke residu , sebut ini "model sementara"
  6. Hitung prediksi dari model sementara untuk setiap kondisi (prediksi ini akan mendekati nol), sebut ini "prediksi sementara"
  7. Tambahkan prediksi sementara ke prediksi asli, sebut hasilnya "prediksi sampel"
  8. Ulangi langkah 4 hingga 7 berkali-kali, menghasilkan distribusi prediksi resample untuk setiap kondisi dari mana sekali dapat menghitung CI.

Saya telah melihat prosedur "residual bootstrap" dalam konteks regresi sederhana (yaitu bukan model campuran) di mana residu dijadikan sampel sebagai unit resampling dan kemudian ditambahkan ke prediksi model asli sebelum memasang model baru pada setiap iterasi dari bootstrap, tetapi ini agak berbeda dari pendekatan yang saya jelaskan di mana residu tidak pernah di-resampled, orang-orang, dan hanya setelahmodel sementara diperoleh apakah prediksi model asli ikut bermain. Fitur terakhir ini memiliki manfaat sampingan yang benar-benar bagus karena tidak peduli kompleksitas model aslinya, model sementara dapat selalu cocok sebagai model campuran linier gaussian, yang dapat jauh lebih cepat dalam beberapa kasus. Sebagai contoh, saya baru-baru ini memiliki data binomial dan 3 variabel prediktor, salah satunya saya duga akan menyebabkan efek sangat non-linear, jadi saya harus menggunakan Generalized Additive Mixed Modeling menggunakan fungsi tautan binomial. Pemasangan model asli dalam kasus ini membutuhkan waktu lebih dari satu jam, sedangkan pemasangan LMM gaussian pada setiap iterasi hanya membutuhkan beberapa detik.

Saya benar-benar tidak ingin mengklaim prioritas pada hal ini jika prosedurnya sudah diketahui, jadi saya akan sangat berterima kasih jika ada yang bisa memberikan informasi di mana ini mungkin telah dijelaskan sebelumnya. (Juga, jika ada masalah mencolok dengan pendekatan ini, beri tahu saya!)

Mike Lawrence
sumber
1
Hanya komentar sampingan, tetapi mungkin relevan. Peter McCullagh memiliki sebuah makalah di Bernoulli di mana ia menunjukkan bahwa tidak ada bootstrap yang benar memperkirakan varians dalam model efek acak.
kardinal
@ Mike (+1) Itu adalah satu pertanyaan yang ditulis dengan sangat baik!
chl
1
Mengapa Anda tidak akan menguji ulang peserta dengan penggantian dan kemudian mengubah data juga? Itu tampaknya lebih sesuai dengan semangat model bertingkat dengan satu distribusi bersarang di dalam yang lain. Poin lain adalah bahwa ada masalah potensial dengan data binomial karena ujung ekstrem dari sampel akan cenderung untuk bertemu.
John
@ John: Saya lebih suka resampling residu karena (1) lebih cepat ketika model asli sulit untuk memperkirakan, dan (2) menghasilkan CI yang telah menghilangkan variabilitas yang disebabkan oleh variabilitas antara cara-cara partisipan. # 2 berarti Anda tidak perlu membuat banyak plot saat ingin menampilkan data mentah dan efek tindakan berulang; Anda bisa memplot CI-varians yang dihilangkan antara varians ini pada data mentah dan akan sesuai untuk perbandingan kondisi yang diulang dalam individu. Memang mungkin ada kebingungan pada arti CIs seperti itu, tapi itulah gunanya keterangan gambar.
Mike Lawrence
@ John: Bisakah Anda menguraikan ketakutan Anda mengenai penerapan pendekatan ini terhadap data binomial?
Mike Lawrence

Jawaban:

-1

Buku saya Metode Bootstrap Edisi ke-2 memiliki bibliografi yang sangat besar hingga 2007. Jadi bahkan jika saya tidak membahas subjek dalam buku ini, rujukannya mungkin ada di bibliografi. Tentu saja pencarian Google dengan kata kunci yang tepat mungkin lebih baik. Freedman, Peters dan Navidi melakukan bootstrap untuk prediksi dalam regresi linier dan model ekonometrik tetapi saya tidak yakin apa yang telah dilakukan pada kasus model campuran. Interval prediksi Bootstrap kertas JASA tahun 1985 dari Stine untuk regresi adalah sesuatu yang Anda akan temukan sangat menarik jika Anda belum melihatnya.

Michael R. Chernick
sumber