Dalam kondisi apa seseorang harus mempertimbangkan untuk menggunakan analisis bertingkat / hierarkis yang bertentangan dengan analisis yang lebih mendasar / tradisional (misalnya, ANOVA, regresi OLS, dll.)? Apakah ada situasi di mana ini dapat dianggap wajib? Apakah ada situasi di mana menggunakan analisis bertingkat / hierarkis tidak pantas? Akhirnya, apa saja sumber daya yang baik bagi pemula untuk belajar analisis bertingkat / hirarkis?
mixed-model
multilevel-analysis
Patrick
sumber
sumber
Jawaban:
Ketika struktur data Anda secara hierarkis atau bersarang, pemodelan multilevel adalah kandidat yang baik. Secara umum, ini adalah salah satu metode untuk memodelkan interaksi.
Contoh alami adalah ketika data Anda berasal dari struktur yang terorganisir seperti negara, negara bagian, distrik, tempat Anda ingin memeriksa efek di tingkat-tingkat itu. Contoh lain di mana Anda bisa cocok dengan struktur seperti itu adalah analisis longitudinal, di mana Anda telah mengulangi pengukuran dari banyak mata pelajaran dari waktu ke waktu (misalnya beberapa respon biologis terhadap dosis obat). Satu level model Anda mengasumsikan respons rata-rata grup untuk semua subjek dari waktu ke waktu. Tingkat lain dari model Anda kemudian memungkinkan untuk gangguan (efek acak) dari rata-rata kelompok, untuk memodelkan perbedaan individual.
Buku yang populer dan bagus untuk memulai adalah Analisis Data Gelman Menggunakan Regresi dan Model Bertingkat / Hirarki .
sumber
Center for Multilevel Modeling memiliki beberapa tutorial online gratis yang bagus untuk pemodelan multi-level, dan mereka memiliki tutorial perangkat lunak untuk pemasangan model di kedua perangkat lunak MLwiN dan STATA mereka.
Anggap ini sebagai bid'ah, karena saya belum membaca lebih dari satu bab dalam buku ini, tetapi model linier Hierarkis: aplikasi dan metode analisis data Oleh Stephen W. Raudenbush, Anthony S. Bryk sangat direkomendasikan. Saya juga bersumpah ada buku tentang pemodelan multi level menggunakan perangkat lunak R di Springer Use R! seri, tetapi saya tampaknya tidak dapat menemukannya saat ini (saya pikir itu ditulis oleh orang yang sama yang menulis buku A Beginner's Guide to R).
sunting: Buku tentang menggunakan R untuk model multi-level adalah Model Efek Campuran dan Ekstensi dalam Ekologi dengan R oleh Zuur, AF, Ieno, EN, Walker, N., Saveliev, AA, Smith, GM
semoga berhasil
sumber
Berikut ini perspektif lain tentang penggunaan model multilevel vs regresi: Dalam sebuah makalah yang menarik oleh Afshartous dan de Leeuw, mereka menunjukkan bahwa jika tujuan pemodelannya adalah prediksi (yaitu, untuk memprediksi pengamatan baru), pilihan model berbeda dari saat tujuannya adalah inferensi (tempat Anda mencoba mencocokkan model dengan struktur data). Makalah yang saya maksudkan adalah
Afshartous, D., de Leeuw, J. (2005). Prediksi dalam model bertingkat. J. Educat. Behav. Statist. 30 (2): 109–139.
Saya baru saja menemukan makalah terkait lainnya oleh penulis di sini: http://moya.bus.miami.edu/~dafshartous/Afshartous_CIS.pdf
sumber
Dengan model yang ada, masalah menjadi salah satu estimasi. Jika Anda memiliki banyak sekolah dan banyak data untuk setiap sekolah, properti OLS yang bagus (lihat Angrist dan Pischke, Sebagian Besar Tidak Berbahaya ..., untuk ulasan saat ini) menyarankan agar Anda ingin menggunakannya, dengan penyesuaian yang sesuai untuk kesalahan standar untuk memperhitungkan dependensi, dan menggunakan variabel dummy dan interaksi untuk mendapatkan efek di tingkat sekolah dan intersep khusus sekolah. OLS mungkin tidak efisien, tetapi sangat transparan sehingga lebih mudah meyakinkan audiens yang skeptis jika Anda menggunakannya. Tetapi jika data Anda jarang dengan cara tertentu --- terutama jika Anda memiliki beberapa pengamatan untuk beberapa sekolah --- Anda mungkin ingin memaksakan lebih "struktur" pada masalah. Anda mungkin ingin "meminjam kekuatan" dari sekolah sampel yang lebih besar untuk meningkatkan perkiraan berisik yang akan Anda dapatkan di sekolah sampel kecil jika estimasi dilakukan tanpa struktur. Kemudian, Anda dapat beralih ke model efek acak yang diperkirakan melalui FGLS,
Dalam contoh ini, penggunaan model bertingkat (namun kami memutuskan untuk mencocokkannya, pada akhirnya) dimotivasi oleh minat langsung pada intersep di tingkat sekolah. Tentu saja, dalam situasi lain, parameter level grup ini mungkin tidak lebih dari gangguan. Apakah Anda perlu menyesuaikannya atau tidak (dan, karena itu, masih bekerja dengan beberapa jenis model bertingkat) tergantung pada apakah asumsi eksogenitas bersyarat tertentu berlaku. Untuk itu, saya akan merekomendasikan berkonsultasi literatur ekonometrik pada metode data panel; sebagian besar wawasan dari sana terbawa ke konteks data umum yang dikelompokkan.
sumber
Pemodelan multi-level sesuai, seperti namanya, ketika data Anda memiliki pengaruh yang terjadi di tingkat yang berbeda (individu, dari waktu ke waktu, melalui domain, dll). Pemodelan tingkat tunggal mengasumsikan semuanya terjadi pada tingkat terendah. Hal lain yang dilakukan model multi-level adalah memperkenalkan korelasi antar unit bersarang. Jadi unit level-1 dalam unit level-2 yang sama akan dikorelasikan.
Dalam beberapa hal Anda dapat menganggap pemodelan multi-level sebagai menemukan jalan tengah antara "fallacy individualis" dan "fallacy ekologis". Kekeliruan individualis adalah ketika "efek komunitas" diabaikan seperti kompatibilitas gaya guru dengan gaya belajar siswa, misalnya (efeknya diasumsikan berasal dari individu saja, jadi lakukan saja regresi pada level 1). sedangkan "fallacy ekologi" adalah kebalikannya, dan akan seperti mengandaikan guru terbaik memiliki siswa dengan nilai terbaik (dan agar level-1 tidak diperlukan, cukup lakukan regresi sepenuhnya pada level 2). Di sebagian besar pengaturan, tidak ada yang sesuai (siswa-guru adalah contoh "klasik").
sumber
Secara umum, berbicara analisis hirarki bayesian (HB) akan mengarah pada estimasi tingkat individu yang efisien dan stabil kecuali jika data Anda sedemikian rupa sehingga efek tingkat individu benar-benar homogen (skenario yang tidak realistis). Estimasi parameter efisiensi dan stabil dari model HB menjadi sangat penting ketika Anda memiliki data yang jarang (mis., Tidak kurang dari obs daripada parameter tidak pada tingkat individu) dan ketika Anda ingin memperkirakan estimasi tingkat individu.
Namun, model HB tidak selalu mudah untuk diperkirakan. Karena itu, walaupun analisis HB biasanya mengalahkan analisis non-HB, Anda harus mempertimbangkan biaya relatif vs manfaat berdasarkan pengalaman masa lalu Anda dan prioritas Anda saat ini dalam hal waktu dan biaya.
Setelah mengatakan bahwa jika Anda tidak tertarik pada estimasi tingkat individu maka Anda dapat memperkirakan model tingkat agregat tetapi bahkan dalam konteks ini memperkirakan model agregasi melalui HB menggunakan estimasi tingkat individu dapat membuat banyak akal.
Singkatnya, pemasangan model HB adalah pendekatan yang disarankan selama Anda punya waktu dan kesabaran untuk menyesuaikannya. Anda kemudian dapat menggunakan model agregat sebagai patokan untuk menilai kinerja model HB Anda.
sumber
Saya belajar dari Snijders dan Bosker, Analisis Multilevel: Pengantar pemodelan multilevel dasar dan lanjutan. Saya pikir itu sangat baik untuk pemula, itu pasti karena saya orang yang tebal dalam hal-hal ini dan itu masuk akal bagi saya.
Aku juga Gelman dan Hill, buku yang benar-benar brilian.
sumber
Model multi-level harus digunakan ketika data bersarang dalam struktur hirarkis, terutama ketika ada perbedaan yang signifikan antara unit tingkat yang lebih tinggi dalam variabel dependen (mis., Orientasi pencapaian siswa bervariasi antara siswa, dan juga antara kelas yang dengannya siswa bersarang). Dalam situasi seperti ini, observasi lebih terkelompok daripada independen. Kegagalan untuk memperhitungkan pengelompokan menyebabkan kesalahan estimasi estimasi parameter, pengujian signifikansi bias, dan kecenderungan untuk menolak null ketika harus dipertahankan. Dasar pemikiran untuk menggunakan model multi level, serta penjelasan menyeluruh tentang bagaimana melakukan analisis, disediakan oleh
Raudenbush, SW Bryk, AS (2002). Model linear hierarki: Aplikasi dan metode analisis data. Edisi ke-2. Newbury Park, CA: Sage.
Buku R & B juga terintegrasi dengan baik dengan paket perangkat lunak HLM penulis, yang banyak membantu dalam mempelajari paket. Penjelasan mengapa model multi-level diperlukan dan lebih disukai untuk beberapa alternatif (seperti pengkodean dummy unit tingkat yang lebih tinggi) disediakan dalam makalah klasik
Hoffman, DA (1997). Tinjauan umum tentang logika dan dasar pemikiran dari Model Linier Hirarki. Jurnal Manajemen, 23, 723-744.
Makalah Hoffman dapat diunduh secara gratis jika Anda Google "Hoffman 1997 HLM" dan mengakses pdf online.
sumber