Kapan harus menggunakan persamaan estimasi umum vs model efek campuran?

63

Saya cukup senang menggunakan model efek campuran untuk sementara waktu sekarang dengan data longitudinal. Saya berharap saya dapat menyesuaikan hubungan AR dengan Lmer (saya pikir saya benar bahwa saya tidak bisa melakukan ini?) Tapi saya tidak berpikir itu sangat penting sehingga saya tidak terlalu khawatir.

Saya baru saja menemukan persamaan estimasi umum (GEE), dan mereka tampaknya menawarkan lebih banyak fleksibilitas daripada model ME.

Dengan risiko mengajukan pertanyaan yang terlalu umum, apakah ada saran yang lebih baik untuk tugas yang berbeda? Saya telah melihat beberapa makalah membandingkannya, dan mereka cenderung berbentuk:

"Di area yang sangat terspesialisasi ini, jangan gunakan GEE untuk X, jangan gunakan model ME untuk Y".

Saya belum menemukan saran yang lebih umum. Adakah yang bisa menyadarkan saya?

Terima kasih!

Chris Beeley
sumber
1
"mereka tampaknya menawarkan lebih banyak fleksibilitas" ... Yah, mereka juga berbeda dalam pendekatan mereka karena GEE digunakan agar sesuai dengan distribusi marjinal, bertentangan dengan pendekatan kondisional yang sering menarik ketika menggunakan GLMM.
chl
Catatan yang glmmPQLjuga bisa cocok dengan struktur korelasi AR
Tom Wenseleers
Apa itu Hubungan AR?
Belajar statistik dengan contoh
@incodeveritas Struktur kovarians autoregresif
Tommyixi

Jawaban:

56

Gunakan GEE ketika Anda tertarik untuk mengungkap efek rata-rata populasi dari kovariat vs efek spesifik individu. Kedua hal ini hanya setara dalam model linier, tetapi tidak dalam model non-linear (mis. Logistik). Untuk melihat ini, ambil, misalnya model logistik efek acak observasi ' subjek ke - i , Y i j ;jiYsayaj

catatan(halsayaj1-halsayaj)=μ+ηsaya

ηsayaN(0,σ2)sayahalsayaj=P(Ysayaj=1|ηsaya)

μ

Jika Anda menggunakan GEE pada data ini, Anda akan memperkirakan peluang log rata-rata populasi. Dalam hal ini yang akan terjadi

ν=catatan(Eη(11+e-μ-ηsaya)1-Eη(11+e-μ-ηsaya))

νμμ=1σ2=1ν0,83

Sunting: Secara umum, model efek campuran tanpa prediksi dapat ditulis sebagai

ψ(E(Ysayaj|ηsaya))=μ+ηsaya

ψ

ψ(Eη(ψ-1(E(Ysayaj|ηsaya))))Eη(E(Ysayaj|ηsaya))

ψ(x)=x

Sunting 2: Perlu juga dicatat bahwa kesalahan standar tipe sandwich "kuat" yang dihasilkan oleh model GEE memberikan interval kepercayaan asimptotik yang valid (misalnya mereka sebenarnya mencakup 95% dari waktu) bahkan jika struktur korelasi yang ditentukan dalam model tidak benar.

Sunting 3: Jika minat Anda dalam memahami struktur asosiasi dalam data, estimasi asosiasi GEE terkenal tidak efisien (dan kadang-kadang tidak konsisten). Saya telah melihat referensi untuk ini tetapi tidak dapat menempatkannya sekarang.

Makro
sumber
3
(+1) Tentang hasil edit kedua Anda, saya akan menambahkan bahwa penduga varians berbasis model akan bekerja lebih baik dengan sejumlah kecil cluster (atau kita dapat menggunakan penduga Jacknife). Adapun referensi, saya selalu menunjuk ke gbi.agrsci.dk/statistics/courses/phd07/material/Day10 , yang berisi catatan kuliah yang sangat bagus (latar belakang stat, termasuk perbandingan pendekatan GEE vs GLMM + ilustrasi di R) .
chl
Wow, jawaban yang bagus. Terima kasih banyak. Itu benar-benar yang saya cari. Dan terima kasih kepada chl juga untuk tautannya. +10 internet untuk Anda berdua.
Chris Beeley
Bukankah GEE juga berasumsi bahwa efek level yang lebih tinggi adalah parameter gangguan? Bagi saya itu adalah perbedaan penting lainnya - jika seseorang tertarik pada efek tersebut, maka GEE tidak akan memberikannya kepada Anda. Atau, jika Anda tidak nyaman membuat asumsi distribusi tersebut, maka mungkin GEE lebih disukai.
robin.datadrivers
Tautan yang disediakan @chl sudah mati: / (enam tahun kemudian agaknya diharapkan, bukan?)
Guilherme Marthe
@GuilhermeMarthe Tangkapan bagus! Sayangnya, saya tertaut ke materi yang sama di utas lain . Saya melihat dua opsi: referensi paket geepack R (dikembangkan oleh dua penulis yang sama) atau menggunakan Mesin WayBack untuk saat ini.
chl
10

GEE dalam pikiran saya paling berguna ketika kita tidak menggunakan pemodelan Bayesian dan ketika solusi kemungkinan penuh tidak tersedia. Selain itu, GEE mungkin memerlukan ukuran sampel yang lebih besar agar cukup akurat, dan sangat tidak kuat untuk data longitudinal yang hilang secara acak. GEE mengasumsikan hilang sepenuhnya secara acak sedangkan metode kemungkinan (model efek campuran atau kuadrat terkecil yang digeneralisasi, misalnya) mengasumsikan hanya hilang secara acak.

Frank Harrell
sumber
1

Anda dapat menemukan diskusi menyeluruh dan contoh nyata dalam Fitzmaurice, Laird and Ware, Analisis Longitudinal Terapan , John Wiley & Sons, 2011, edisi ke-2, Bab 11-16.

Sebagai contoh, Anda dapat menemukan kumpulan data dan program SAS / Stata / R di situs web pendamping .

Sergio
sumber
2
Bisakah Anda merangkum poin-poin utama buku ini?
chl
2
Saya akan mengatakan bahwa Makro telah melakukannya ;-) Dalam buku ini Anda dapat menemukan diskusi yang lebih panjang dan lebih rinci, beberapa contoh analitis, numerik dan grafik, dan beberapa poin lebih lanjut, di antaranya apa yang telah ditambahkan Frank Harrell. Anda juga bisa melihat blog Gelman .
Sergio