Clustered standard error vs multilevel modeling?

18

Saya telah membaca beberapa buku (Raudenbush & Bryk, Snijders & Bosker, Gelman & Hill, dll.) Dan beberapa artikel (Gelman, Jusko, Primo & Jacobsmeier, dll.), Dan saya masih belum benar-benar membungkus kepala saya perbedaan utama antara menggunakan kesalahan standar berkerumun ayat pemodelan bertingkat.

Saya memahami bagian-bagian yang berkaitan dengan pertanyaan penelitian yang ada; ada beberapa jenis jawaban yang hanya bisa Anda dapatkan dari pemodelan multilevel. Namun, misalnya, untuk model dua tingkat di mana koefisien minat Anda hanya pada tingkat kedua, apa keuntungan melakukan satu metode daripada yang lain? Dalam hal ini, saya tidak khawatir membuat prediksi atau mengekstraksi koefisien individu untuk cluster.

Perbedaan utama yang saya dapat temukan adalah bahwa kesalahan standar berkerumun menderita ketika cluster memiliki ukuran sampel yang tidak sama dan bahwa pemodelan multilevel lemah karena mengasumsikan spesifikasi distribusi koefisien acak (sedangkan menggunakan kesalahan standar berkerumun bebas model) .

Dan pada akhirnya, apakah semua ini berarti bahwa untuk model yang seolah-olah dapat menggunakan kedua metode tersebut, kita harus mendapatkan hasil yang sama dalam hal koefisien dan kesalahan standar?

Segala tanggapan atau sumber daya yang bermanfaat akan sangat dihargai.

RickyB
sumber
6
user Stask memiliki jawaban yang bagus untuk pertanyaan ini .
Andy W
Terima kasih. Saya pernah membaca itu sebelumnya, yang sebenarnya membuat saya lebih skeptis dengan manfaat sebenarnya. Namun, saya kira motivasi sebenarnya di balik pertanyaan saya adalah untuk melihat apakah saya sama sekali divalidasi dalam berpikir bahwa itu tidak terlalu berguna jika saya hanya melihat koefisien level dua sebagai hal yang menarik. Selain itu, mungkin saya melewatkannya, tetapi saya tidak berpikir bahwa posting membahas apakah kedua metode ini harus menghasilkan hasil yang sama (ketika asumsi kedua metode terpenuhi).
RickyB
1
Dengan "koefisien pada tingkat kedua" yang Anda maksud adalah tingkat di mana Anda parameter dari tahap pertama sebagai variabel dependen?
sheß
Ya, itulah yang saya maksud.
RickyB

Jawaban:

1

Posting ini berdasarkan pada pengalaman pribadi yang mungkin spesifik untuk data saya, jadi saya tidak yakin itu memenuhi syarat sebagai jawaban.

Saya sarankan untuk menggunakan simulasi jika memungkinkan untuk menilai metode mana yang paling cocok untuk data Anda. Saya melakukan ini dan terkejut menemukan bahwa tes (mengenai parameter di tingkat pertama) berdasarkan pemodelan bertingkat banyak mengungguli metode lain (daya-bijaksana), sementara mempertahankan ukuran bahkan dalam sampel kecil dengan beberapa "cluster" berukuran kecil dan tidak merata. Saya belum menemukan makalah yang menunjukkan hal itu, dan dari cara saya melihat ini sebenarnya bukan topik yang menarik dan patut mendapat perhatian lebih. Saya pikir cukup diteliti bagaimana metode yang berbeda membandingkan vis-a-vis sampel-terbatas atau beberapa cluster yang tidak merata.

sheß
sumber
Terima kasih atas komentarmu. Apakah Anda memiliki dokumen di mana Anda mencatat hasil Anda? Saya akan sangat tertarik melihatnya dan melihat apa yang Anda temukan (dan, tentu saja, saya tidak akan mengutip, berbagi, atau memperbaikinya tanpa mendiskusikannya dengan Anda).
RickyB