Matriks varians-kovarians dalam lmer

18

Saya tahu bahwa salah satu keuntungan dari model campuran adalah bahwa mereka memungkinkan untuk menentukan matriks varians-kovarians untuk data (simetri gabungan, autoregresif, tidak terstruktur, dll.) Namun, lmerfungsi dalam R tidak memungkinkan spesifikasi mudah dari matriks ini. Adakah yang tahu struktur apa yang lmerdigunakan secara default dan mengapa tidak ada cara untuk menentukannya dengan mudah?

Nikita Kuznetsov
sumber

Jawaban:

9

Model campuran adalah (versi umum dari) model komponen varians. Anda menuliskan bagian efek tetap, menambahkan istilah kesalahan yang mungkin umum untuk beberapa kelompok pengamatan, menambahkan fungsi tautan jika diperlukan, dan memasukkannya ke dalam likelihood maximizer.

Namun, berbagai struktur varians yang Anda gambarkan adalah model korelasi yang berfungsi untuk persamaan estimasi umum, yang menukar beberapa fleksibilitas dari model campuran / multilevel untuk ketahanan inferensi. Dengan GEE, Anda hanya tertarik untuk melakukan inferensi pada bagian yang tetap, dan Anda OK dengan tidak memperkirakan komponen varians, seperti yang Anda lakukan pada model campuran. Untuk efek yang diperbaiki ini, Anda mendapatkan taksiran yang kuat / sandwich yang sesuai bahkan ketika struktur korelasi Anda misspecfieid. Inferensi untuk model campuran akan rusak jika model tersebut tidak ditentukan spesifikasi.

Jadi sementara memiliki banyak kesamaan (struktur bertingkat dan kemampuan untuk mengatasi korelasi residual), model campuran dan GEE masih merupakan prosedur yang agak berbeda. Paket R yang berhubungan dengan GEE disebut dengan tepat gee, dan dalam daftar nilai-nilai corstropsi yang memungkinkan Anda akan menemukan struktur yang Anda sebutkan.

Dari sudut pandang GEE, lmerbekerja dengan korelasi yang dapat dipertukarkan ... setidaknya ketika model memiliki dua tingkat hierarki, dan hanya intersep acak yang ditentukan.

Tugas
sumber
Terima kasih, Stas. Saya belum pernah mendengar GEE sebelumnya dan hanya mencoba mempelajari pemodelan campuran (yang rumit dan juga diperkuat oleh perbedaan dalam implementasi perangkat lunak). Saya akan mencoba GEE. Saya benar-benar memiliki percobaan sederhana dengan tindakan berulang dengan tindakan tergantung biomedis. Saya tertarik pada bagian yang diperbaiki sebagian besar. Pelatihan saya sebelumnya sebagian besar di ANOVA efek tetap standar sehingga mungkin transisi yang lebih mudah.
Nikita Kuznetsov
Saya menyukai gagasan memperkirakan parameter tetap dan telah mencoba pustaka gee. Ada juga perpustakaan lain (geepack, misalnya). Apakah mereka lebih buruk karena suatu alasan? Di bidang saya, orang perlu melaporkan nilai-p. Apakah ada cara untuk mendapatkan ini dari perkiraan dan juga melakukan perbandingan berpasangan dengan mempertimbangkan pengelompokan?
Nikita Kuznetsov
Perbandingan berpasangan tentang apa? Berbagai perpustakaan R selalu membuat saya gila, dan saya tidak meneliti perbedaan antara paket kecuali saya memiliki kebutuhan nyata untuk bekerja pada model tertentu.
Tugas
StatsK, apakah ini benar? Saya seorang pemula dalam pemodelan multilevel tetapi Hox (2010) atau Rabe-Hesketh & Skrondal (2013) jelas membedakan antara penduga varians yang berbeda melalui MLE dan GEE. Sebagai contoh ketika menghitung kesalahan standar sandwich "kuat", Hox (hlm. 260) mengatakan Anda dapat menghitungnya melalui pemodelan bertingkat menggunakan matriks Informasi / kebalikan dari matriks Hessian (memperhitungkan struktur bertingkat ke akun) atau dengan memperkirakan varians dari residu mentah dan menggunakan GLS sesudahnya untuk menghitung koefisien (pendekatan GEE)
Arne Jonas Warnke
1
Saya tidak yakin perbedaan yang disarankan oleh StasK benar di sini. Walaupun struktur korelasi alternatif ini memang digunakan oleh GEE, sangat mungkin untuk mencocokkan model (parametrik penuh) dengan struktur yang lebih rumit untuk kovarians baik efek acak atau kesalahan residual, dan paket nlme dalam R, SAS Proc Mixed, atau Perintah campuran Stata melakukan ini.
Jonathan Bartlett
4

Cabang FlexLamba dari lmer menyediakan fungsi seperti itu.

Lihat https://github.com/lme4/lme4/issues/224 untuk contoh bagaimana menerapkan struktur kesalahan atau efek acak tertentu.

majom
sumber
Bisakah saya menginstal cabang reguler dan FlexLambda sekaligus? Bagaimana?
skan
3

Sepengetahuan saya, Lmer tidak memiliki cara "mudah" untuk mengatasi ini. Juga mengingat bahwa dalam banyak kasus lmer banyak menggunakan matriks jarang untuk faktorisasi Cholesky saya akan menemukan itu tidak mungkin yang memungkinkan untuk VCV yang benar-benar tidak terstruktur.

(1|RSebuahndEff1)+(1|RSebuahndEff2)

R=[σRE12000000σRE12000000σRE12000000σRE22000000σRE22000000σRE22]

Semua tidak hilang dengan LME: Anda dapat menentukan atribut matriks VCV ini "dengan mudah" adalah Anda menggunakan MCMCglmm paket-R. Lihatlah CourseNotes.pdf , hal.70. Pada halaman itu ia memberikan beberapa analog tentang bagaimana struktur efek acak lme4 akan didefinisikan tetapi seperti yang Anda lihat sendiri, lmer kurang fleksibel daripada MCMCglmm dalam hal ini.

Setengah jalan ada kelas masalah lme's lme corStruct, misalnya. corCompSymm , corAR1 , dll. Respons Fabian dalam tapak ini memberikan beberapa contoh yang lebih ringkas untuk spesifikasi VCV berbasis lme4 tetapi seperti yang disebutkan sebelumnya, mereka tidak sejelas yang ada di MCMCglmm atau nlme.

usεr11852 kata Reinstate Monic
sumber
Saya tidak "percaya" MCMCglmm, karena pilihan naif dari distribusi sebelumnya.
Stéphane Laurent
A. Saya tidak berpikir itu "naif"; mereka dapat mencerminkan asumsi yang valid. Anda bahkan dapat mendefinisikan prior yang tidak tepat jika Anda merasakan hal itu dengan kuat. B. Itu hanya sebagian dari jawaban saya, tidak mengatakan itu adalah satu-satunya cara untuk pergi; Saya memberi contoh untuk lme4. C. Jika Anda perlu melakukan multivariate efek campuran itu praktis satu-satunya paket yang tersedia bersama dengan sabreR ...
usεr11852 mengatakan Reinstate Monic
Maaf, komentar saya bukan kritik tentang jawaban Anda. Ketika mengatakan "prior naif", saya berbicara tentang prior noninformatif.
Stéphane Laurent
Tampaknya tidak mungkin bahwa matriks R ini benar. Bahkan ANOVA yang diulang-ulang "klasik" memungkinkan korelasi yang tidak nol antara kondisi (Saya sedang memikirkan matriks simetri gabungan). Menurut saya, matriks ini hanya akan valid untuk desain antar-subjek dengan penugasan acak dengan dua cluster.
Nikita Kuznetsov
(1|RSebuahndEff1)+(1|RSebuahndEff2)