Memperoleh dan menafsirkan interval kepercayaan bootstrap dari data hierarkis

Saya tertarik untuk mendapatkan interval kepercayaan bootstrap pada kuantitas X, ketika jumlah ini diukur 10 kali pada masing-masing 10 orang.

Salah satu pendekatan adalah untuk mendapatkan rata-rata per individu, kemudian bootstrap berarti (mis. Sampel ulang sarana dengan penggantian).

Pendekatan lain adalah melakukan hal berikut pada setiap iterasi dari prosedur bootstrap: dalam setiap individu, resample 10 pengamatan individu dengan penggantian, kemudian menghitung rata-rata baru untuk individu itu, dan akhirnya menghitung rata-rata kelompok baru. Dalam pendekatan ini, setiap individu yang diamati dalam set data asli selalu berkontribusi pada rata-rata grup pada setiap iterasi dari prosedur bootstrap.

Akhirnya, pendekatan ketiga adalah menggabungkan dua pendekatan di atas: resample individu kemudian resample dalam individu tersebut. Pendekatan ini berbeda dari pendekatan sebelumnya dalam hal ini memungkinkan individu yang sama untuk berkontribusi ganda pada rata-rata grup pada setiap iterasi, meskipun karena setiap kontribusi dihasilkan melalui prosedur resampling independen, kontribusi ini mungkin diharapkan sedikit berbeda dari satu sama lain.

Dalam praktiknya, saya menemukan bahwa pendekatan ini menghasilkan perkiraan yang berbeda untuk interval kepercayaan (mis. Dengan satu set data, saya menemukan bahwa pendekatan ketiga menghasilkan interval kepercayaan yang jauh lebih besar daripada dua pendekatan pertama), jadi saya ingin tahu apa masing-masing mungkin diartikan untuk mewakili.

confidence-interval bootstrap Mike Lawrence
sumber

Jawaban:

Pendekatan pertama Anda adalah tentang antara S CI. Jika Anda ingin mengukur dalam S maka itu pendekatan yang salah.

Pendekatan kedua akan menghasilkan dalam S CI yang hanya akan berlaku untuk 10 orang tersebut.

Pendekatan terakhir adalah yang benar untuk dalam S CI. Setiap kenaikan CI adalah karena CI Anda lebih mewakili CI yang dapat diterapkan pada populasi daripada 10 S itu.

John
sumber

Menurut Davison dan Hinckley ("Metode Bootstrap dan aplikasinya", 1997, Bagian 3.8), algoritma ketiga adalah konservatif. Mereka menganjurkan pendekatan keempat: cukup resampling subjek.

Andrew Robinson
sumber

Menarik, saya harus mencari referensi itu. Apakah Anda yakin maksud Anda pendekatan "keempat"? Pendekatan pertama yang saya tulis tampaknya menggambarkan "cukup resampling subyek".

Mike Lawrence

Ya, memang, tapi itu menggambarkan resampling berarti subjek. Pendukung D&H melakukan resampling pada subjek dan menyesuaikan model aslinya.

Andrew Robinson

Anda juga mungkin ingin melihat yang baru-baru ini diterbitkan: Ren, Shiquan, Lai, Hong, Tong, Wenjing, Aminzadeh, Mostafa, Hou, Xuezhang dan Lai, Shenghan (2010) 'bootstrap nonparametrik untuk data hierarkis', Jurnal Statistik Terapan, 37: 9, 1487 - 1498

Andrew Robinson

@ Mike: resampling seluruh clsuter adalah apa yang dilakukan oleh ahli statistik survei dalam bootstraps mereka. Itu memang prosedur yang berbeda yang hanya akan setara dengan pendekatan "pertama" Anda jika (i) Anda hanya memperkirakan rata-rata, dan (ii) data tidak tertimbang dan seimbang. Lihat juga citeulike.org/user/ctacmo/article/1334050 , citeulike.org/user/ctacmo/article/1475866 , citeulike.org/user/ctacmo/article/582039 .

Tugas