Saya menjalankan GEE pada data tidak seimbang 3-level, menggunakan tautan logit. Bagaimana hal ini berbeda (dalam hal kesimpulan yang dapat saya gambar dan arti dari koefisien) dari GLM dengan efek campuran (GLMM) dan tautan logit?
Lebih detail: Pengamatan adalah uji coba bernoulli tunggal. Mereka dikelompokkan dikelompokkan ke dalam ruang kelas dan sekolah. Menggunakan R. Dengan santai menghilangkan NAs. 6 prediktor juga istilah interaksi.
(Saya tidak membalik anak-anak untuk melihat apakah mereka mendarat dengan kepala.)
Saya cenderung eksponensial koefisien untuk odds-rasio. Apakah ini memiliki arti yang sama di keduanya?
Ada sesuatu yang mengintai di benak saya tentang "marginal means" dalam model GEE. Saya perlu sedikit menjelaskan kepada saya.
Terima kasih.
Jawaban:
Dalam hal interpretasi koefisien, ada perbedaan dalam kasus biner (antara lain). Apa yang berbeda antara GEE dan GLMM adalah target kesimpulan: rata-rata populasi atau subjek tertentu .
Mari kita perhatikan contoh sederhana yang dibuat terkait dengan milik Anda. Anda ingin memodelkan tingkat kegagalan antara anak laki-laki dan perempuan di sekolah. Seperti kebanyakan sekolah (SD), populasi siswa dibagi menjadi ruang kelas. Anda mengamati respons biner dari anak-anak di ruang kelas (yaitu respons biner yang dikelompokkan menurut ruang kelas), di mana jika siswa dari kelas yang lewati dan jika dia gagal. Dan jika siswa dari kelas adalah pria dan 0 sebaliknya.n i N ∑ N i = 1 n i Y i j = 1 j i Y i j = 0 x i j = 1 j iY nsaya N ∑Ni = 1nsaya Ysaya j= 1 j saya Ysaya j= 0 xsaya j= 1 j saya
Untuk memasukkan terminologi yang saya gunakan pada paragraf pertama, Anda dapat menganggap sekolah sebagai populasi dan ruang kelas adalah subjeknya .
Pertama-tama pertimbangkan GLMM. GLMM cocok dengan model efek campuran. Kondisi model pada matriks desain tetap (yang dalam hal ini terdiri dari intersep dan indikator untuk gender) dan setiap efek acak di antara ruang kelas yang kami sertakan dalam model. Dalam contoh kami, mari kita sertakan intersepsi acak, , yang akan mempertimbangkan perbedaan baseline dalam tingkat kegagalan di antara ruang kelas. Jadi kami membuat modelbsaya
Rasio odds risiko kegagalan dalam model di atas berbeda berdasarkan pada nilai yang berbeda di antara ruang kelas. Dengan demikian, estimasi tersebut bersifat spesifik per subjek .bsaya
GEE, di sisi lain, cocok dengan model marginal. Rata-rata model populasi ini . Anda memodelkan harapan hanya pada matriks desain tetap Anda.
Ini berbeda dengan model efek campuran seperti dijelaskan di atas yang kondisi pada kedua matriks desain tetap dan efek acak. Jadi dengan model marginal di atas Anda mengatakan, "lupakan perbedaan di antara ruang kelas, saya hanya ingin tingkat kegagalan populasi (berdasarkan sekolah) dan hubungannya dengan gender." Anda cocok dengan model dan mendapatkan rasio odds yang merupakan rasio odds rata-rata populasi dari kegagalan yang terkait dengan gender.
Jadi Anda mungkin menemukan bahwa perkiraan Anda dari model GEE Anda mungkin berbeda dengan perkiraan Anda dari model GLMM Anda dan itu karena mereka tidak memperkirakan hal yang sama.
(Sejauh mengkonversi dari rasio odds-log ke odds-rasio dengan secara eksponensial, ya, Anda melakukan itu baik itu tingkat populasi atau estimasi subjek tertentu)
Beberapa Catatan / Sastra:
Untuk kasus linier, estimasi rata-rata populasi dan subjek spesifik adalah sama.
Zeger, dkk. 1988 menunjukkan bahwa untuk regresi logistik,
di mana adalah marginal, adalah estimasi spesifik subjek dan adalah varian dari efek acak.β R E VβM. βR E V
Molenberghs, Verbeke 2005 memiliki seluruh bab tentang model efek marjinal vs acak.
Saya belajar tentang hal ini dan materi terkait dalam kursus yang didasarkan pada Diggle, Heagerty, Liang, Zeger 2002 , sebuah referensi yang bagus.
sumber