Dalam kondisi apa seseorang harus menggunakan analisis bertingkat / hierarkis?

36

Dalam kondisi apa seseorang harus mempertimbangkan untuk menggunakan analisis bertingkat / hierarkis yang bertentangan dengan analisis yang lebih mendasar / tradisional (misalnya, ANOVA, regresi OLS, dll.)? Apakah ada situasi di mana ini dapat dianggap wajib? Apakah ada situasi di mana menggunakan analisis bertingkat / hierarkis tidak pantas? Akhirnya, apa saja sumber daya yang baik bagi pemula untuk belajar analisis bertingkat / hirarkis?

Patrick
sumber

Jawaban:

22

Ketika struktur data Anda secara hierarkis atau bersarang, pemodelan multilevel adalah kandidat yang baik. Secara umum, ini adalah salah satu metode untuk memodelkan interaksi.

Contoh alami adalah ketika data Anda berasal dari struktur yang terorganisir seperti negara, negara bagian, distrik, tempat Anda ingin memeriksa efek di tingkat-tingkat itu. Contoh lain di mana Anda bisa cocok dengan struktur seperti itu adalah analisis longitudinal, di mana Anda telah mengulangi pengukuran dari banyak mata pelajaran dari waktu ke waktu (misalnya beberapa respon biologis terhadap dosis obat). Satu level model Anda mengasumsikan respons rata-rata grup untuk semua subjek dari waktu ke waktu. Tingkat lain dari model Anda kemudian memungkinkan untuk gangguan (efek acak) dari rata-rata kelompok, untuk memodelkan perbedaan individual.

Buku yang populer dan bagus untuk memulai adalah Analisis Data Gelman Menggunakan Regresi dan Model Bertingkat / Hirarki .

ars
sumber
3
Saya kedua jawaban ini dan hanya ingin menambahkan referensi hebat lain pada topik ini: Teks Analisis Data Longitudinal Terapan Singer < gseacademic.harvard.edu/alda >. Meskipun spesifik untuk analisis longitudinal, ini memberikan gambaran umum tentang MLM secara umum. Saya juga menemukan Analisis Multilevel Snidjers dan Bosker bagus dan dapat dibaca < stat.gamma.rug.nl/multilevel.htm >. John Fox juga menyediakan intro yang bagus untuk model-model ini di R di sini < cran.r-project.org/doc/contrib/Fox-Companion/… >.
Brett
Terima kasih atas tanggapan Anda :) Sebagai pertanyaan lanjutan, tidak bisakah sebagian besar data dikonseptualisasikan sebagai hierarki alami / bersarang? Misalnya, dalam sebagian besar studi psikologi terdapat sejumlah variabel dependen (kuesioner, respons stimuli, dll ...) yang bersarang di dalam individu, yang selanjutnya bersarang dalam dua atau lebih kelompok (ditugaskan secara acak atau non-acak). Apakah Anda setuju bahwa ini merupakan struktur data yang hierarkis dan / atau bersarang secara alami?
Patrick
Jika ada di antara Anda para guru multilevel / hierarkis dapat menyisihkan beberapa menit, saya akan sangat berterima kasih jika Anda dapat mempertimbangkan pertanyaan analisis yang diajukan di pos berbeda ( stats.stackexchange.com/questions/1799/… ). Secara khusus, apakah Anda berpikir bahwa data persepsi nyeri yang diuraikan dalam posting itu akan lebih baik dianalisis dengan analisis hierarkis daripada analisis non-hierarkis? Atau apakah itu tidak membuat perbedaan atau bahkan tidak pantas? Terima kasih: D
Patrick
18

Center for Multilevel Modeling memiliki beberapa tutorial online gratis yang bagus untuk pemodelan multi-level, dan mereka memiliki tutorial perangkat lunak untuk pemasangan model di kedua perangkat lunak MLwiN dan STATA mereka.

Anggap ini sebagai bid'ah, karena saya belum membaca lebih dari satu bab dalam buku ini, tetapi model linier Hierarkis: aplikasi dan metode analisis data Oleh Stephen W. Raudenbush, Anthony S. Bryk sangat direkomendasikan. Saya juga bersumpah ada buku tentang pemodelan multi level menggunakan perangkat lunak R di Springer Use R! seri, tetapi saya tampaknya tidak dapat menemukannya saat ini (saya pikir itu ditulis oleh orang yang sama yang menulis buku A Beginner's Guide to R).

sunting: Buku tentang menggunakan R untuk model multi-level adalah Model Efek Campuran dan Ekstensi dalam Ekologi dengan R oleh Zuur, AF, Ieno, EN, Walker, N., Saveliev, AA, Smith, GM

semoga berhasil

Andy W
sumber
9

Berikut ini perspektif lain tentang penggunaan model multilevel vs regresi: Dalam sebuah makalah yang menarik oleh Afshartous dan de Leeuw, mereka menunjukkan bahwa jika tujuan pemodelannya adalah prediksi (yaitu, untuk memprediksi pengamatan baru), pilihan model berbeda dari saat tujuannya adalah inferensi (tempat Anda mencoba mencocokkan model dengan struktur data). Makalah yang saya maksudkan adalah

Afshartous, D., de Leeuw, J. (2005). Prediksi dalam model bertingkat. J. Educat. Behav. Statist. 30 (2): 109–139.

Saya baru saja menemukan makalah terkait lainnya oleh penulis di sini: http://moya.bus.miami.edu/~dafshartous/Afshartous_CIS.pdf

Galit Shmueli
sumber
6

yis=αs+Xisβs+ϵis,
yisisXisβsαsϵisαs

Dengan model yang ada, masalah menjadi salah satu estimasi. Jika Anda memiliki banyak sekolah dan banyak data untuk setiap sekolah, properti OLS yang bagus (lihat Angrist dan Pischke, Sebagian Besar Tidak Berbahaya ..., untuk ulasan saat ini) menyarankan agar Anda ingin menggunakannya, dengan penyesuaian yang sesuai untuk kesalahan standar untuk memperhitungkan dependensi, dan menggunakan variabel dummy dan interaksi untuk mendapatkan efek di tingkat sekolah dan intersep khusus sekolah. OLS mungkin tidak efisien, tetapi sangat transparan sehingga lebih mudah meyakinkan audiens yang skeptis jika Anda menggunakannya. Tetapi jika data Anda jarang dengan cara tertentu --- terutama jika Anda memiliki beberapa pengamatan untuk beberapa sekolah --- Anda mungkin ingin memaksakan lebih "struktur" pada masalah. Anda mungkin ingin "meminjam kekuatan" dari sekolah sampel yang lebih besar untuk meningkatkan perkiraan berisik yang akan Anda dapatkan di sekolah sampel kecil jika estimasi dilakukan tanpa struktur. Kemudian, Anda dapat beralih ke model efek acak yang diperkirakan melalui FGLS,

Dalam contoh ini, penggunaan model bertingkat (namun kami memutuskan untuk mencocokkannya, pada akhirnya) dimotivasi oleh minat langsung pada intersep di tingkat sekolah. Tentu saja, dalam situasi lain, parameter level grup ini mungkin tidak lebih dari gangguan. Apakah Anda perlu menyesuaikannya atau tidak (dan, karena itu, masih bekerja dengan beberapa jenis model bertingkat) tergantung pada apakah asumsi eksogenitas bersyarat tertentu berlaku. Untuk itu, saya akan merekomendasikan berkonsultasi literatur ekonometrik pada metode data panel; sebagian besar wawasan dari sana terbawa ke konteks data umum yang dikelompokkan.

Cyrus S
sumber
1
Ini adalah utas lama, tetapi jika Anda membaca ini: OLS dengan variabel dummy dan interaksi tidak meminjam kekuatan seperti teknik lain yang Anda sebutkan, kan? Saya memiliki beberapa data di mana saya telah memecah analisis saya menjadi dua bagian dan menggunakan dua lm (model linear R) perintah untuk memodelkan dua bagian. Saya memperkenalkan variabel dummy untuk menunjukkan dua bagian, kemudian menggunakan lm lagi pada model "terpadu" ini dan jawabannya dekat, tetapi tidak sama. Pertanyaan saya adalah: apakah jawaban itu "lebih baik", atau hanya berbeda karena algoritme?
Wayne
@Wayne: jika Anda menggunakan boneka dan set interaksi penuh di yang kedua, estimasi titik harus sama. Kesalahan standar mungkin berbeda karena metode kedua mungkin mengasumsikan tingkat kebebasan yang lebih tinggi, tetapi Anda ingin memeriksa apakah itu asumsi pemodelan yang benar.
Cyrus S
6

Pemodelan multi-level sesuai, seperti namanya, ketika data Anda memiliki pengaruh yang terjadi di tingkat yang berbeda (individu, dari waktu ke waktu, melalui domain, dll). Pemodelan tingkat tunggal mengasumsikan semuanya terjadi pada tingkat terendah. Hal lain yang dilakukan model multi-level adalah memperkenalkan korelasi antar unit bersarang. Jadi unit level-1 dalam unit level-2 yang sama akan dikorelasikan.

Dalam beberapa hal Anda dapat menganggap pemodelan multi-level sebagai menemukan jalan tengah antara "fallacy individualis" dan "fallacy ekologis". Kekeliruan individualis adalah ketika "efek komunitas" diabaikan seperti kompatibilitas gaya guru dengan gaya belajar siswa, misalnya (efeknya diasumsikan berasal dari individu saja, jadi lakukan saja regresi pada level 1). sedangkan "fallacy ekologi" adalah kebalikannya, dan akan seperti mengandaikan guru terbaik memiliki siswa dengan nilai terbaik (dan agar level-1 tidak diperlukan, cukup lakukan regresi sepenuhnya pada level 2). Di sebagian besar pengaturan, tidak ada yang sesuai (siswa-guru adalah contoh "klasik").

yijj

probabilityislogic
sumber
4

Secara umum, berbicara analisis hirarki bayesian (HB) akan mengarah pada estimasi tingkat individu yang efisien dan stabil kecuali jika data Anda sedemikian rupa sehingga efek tingkat individu benar-benar homogen (skenario yang tidak realistis). Estimasi parameter efisiensi dan stabil dari model HB menjadi sangat penting ketika Anda memiliki data yang jarang (mis., Tidak kurang dari obs daripada parameter tidak pada tingkat individu) dan ketika Anda ingin memperkirakan estimasi tingkat individu.

Namun, model HB tidak selalu mudah untuk diperkirakan. Karena itu, walaupun analisis HB biasanya mengalahkan analisis non-HB, Anda harus mempertimbangkan biaya relatif vs manfaat berdasarkan pengalaman masa lalu Anda dan prioritas Anda saat ini dalam hal waktu dan biaya.

Setelah mengatakan bahwa jika Anda tidak tertarik pada estimasi tingkat individu maka Anda dapat memperkirakan model tingkat agregat tetapi bahkan dalam konteks ini memperkirakan model agregasi melalui HB menggunakan estimasi tingkat individu dapat membuat banyak akal.

Singkatnya, pemasangan model HB adalah pendekatan yang disarankan selama Anda punya waktu dan kesabaran untuk menyesuaikannya. Anda kemudian dapat menggunakan model agregat sebagai patokan untuk menilai kinerja model HB Anda.


sumber
Terima kasih atas balasan terperinci Anda Srikant :) Saat ini saya tidak terbiasa dengan analisis Bayesian, tetapi saya adalah salah satu topik yang ingin saya selidiki. Apakah analisis Hierarchical Bayesian berbeda dari analisis multilevel / hierarki lainnya yang dibahas pada halaman ini? Jika demikian, apakah Anda memiliki sumber daya yang disarankan bagi pihak yang berminat untuk mempelajari lebih lanjut?
Patrick
Dari perspektif analitis, analisis HB = model multi-level. Namun, istilah model multi-level digunakan ketika Anda memiliki level berbeda yang terjadi secara alami (Lihat contoh @ars). Istilah model HB digunakan ketika Anda tidak harus memiliki level yang berbeda dalam situasi tersebut. Misalnya, jika Anda memodelkan respons konsumen terhadap berbagai variabel pemasaran (mis. Harga, pengeluaran adv, dll.) Maka Anda mungkin memiliki struktur berikut di tingkat konsumen: dan di tingkat populasi. Untuk referensi: Lihat jawaban lain. ˉ βN(.,.)βiN(β¯,Σ)β¯N(.,.)
4

Saya belajar dari Snijders dan Bosker, Analisis Multilevel: Pengantar pemodelan multilevel dasar dan lanjutan. Saya pikir itu sangat baik untuk pemula, itu pasti karena saya orang yang tebal dalam hal-hal ini dan itu masuk akal bagi saya.

Aku juga Gelman dan Hill, buku yang benar-benar brilian.

Chris Beeley
sumber
1

Model multi-level harus digunakan ketika data bersarang dalam struktur hirarkis, terutama ketika ada perbedaan yang signifikan antara unit tingkat yang lebih tinggi dalam variabel dependen (mis., Orientasi pencapaian siswa bervariasi antara siswa, dan juga antara kelas yang dengannya siswa bersarang). Dalam situasi seperti ini, observasi lebih terkelompok daripada independen. Kegagalan untuk memperhitungkan pengelompokan menyebabkan kesalahan estimasi estimasi parameter, pengujian signifikansi bias, dan kecenderungan untuk menolak null ketika harus dipertahankan. Dasar pemikiran untuk menggunakan model multi level, serta penjelasan menyeluruh tentang bagaimana melakukan analisis, disediakan oleh

Raudenbush, SW Bryk, AS (2002). Model linear hierarki: Aplikasi dan metode analisis data. Edisi ke-2. Newbury Park, CA: Sage.

Buku R & B juga terintegrasi dengan baik dengan paket perangkat lunak HLM penulis, yang banyak membantu dalam mempelajari paket. Penjelasan mengapa model multi-level diperlukan dan lebih disukai untuk beberapa alternatif (seperti pengkodean dummy unit tingkat yang lebih tinggi) disediakan dalam makalah klasik

Hoffman, DA (1997). Tinjauan umum tentang logika dan dasar pemikiran dari Model Linier Hirarki. Jurnal Manajemen, 23, 723-744.

Makalah Hoffman dapat diunduh secara gratis jika Anda Google "Hoffman 1997 HLM" dan mengakses pdf online.

StatistikDoc Konsultasi
sumber