Struktur data
> str(data)
'data.frame': 6138 obs. of 10 variables:
$ RT : int 484 391 422 516 563 531 406 500 516 578 ...
$ ASCORE : num 5.1 4 3.8 2.6 2.7 6.5 4.9 2.9 2.6 7.2 ...
$ HSCORE : num 6 2.1 7.9 1 6.9 8.9 8.2 3.6 1.7 8.6 ...
$ MVMNT : Factor w/ 2 levels "_Withd","Appr": 2 2 1 1 2 1 2 1 1 2 ...
$ STIM : Factor w/ 123 levels " arti"," cele",..: 16 23 82 42 105 4 93 9 34 25 ...
$ DRUG : Factor w/ 2 levels "Inactive","Pharm": 1 1 1 1 1 1 1 1 1 1 ...
$ FULLNSS: Factor w/ 2 levels "Fasted","Fed": 2 2 2 2 2 2 2 2 2 2 ...
$ PATIENT: Factor w/ 25 levels "Subj01","Subj02",..: 1 1 1 1 1 1 1 1 1 1 ...
$ SESSION: Factor w/ 4 levels "Sess1","Sess2",..: 1 1 1 1 1 1 1 1 1 1 ...
$ TRIAL : Factor w/ 6138 levels "T0001","T0002",..: 1 2 3 4 5 6 7 8 9 10 ...
Calon Model Lengkap
model.loaded.fit <- lmer(RT ~ ASCORE*HSCORE*MVMNT*DRUG*FULLNSS
+ (1|PATIENT) + (1|SESSION), data, REML = TRUE)
- Waktu reaksi dari percobaan dikelompokkan dalam sesi, yang pada gilirannya dikelompokkan dalam pasien
- Setiap percobaan dapat dikarakteristikkan dengan dua kovariat berkelanjutan dari ASCORE dan HSCORE (berkisar antara 1-9) dan oleh respon gerakan (penarikan atau pendekatan)
- Sesi ditandai dengan asupan obat (plasebo atau pharmacon aktif) dan oleh kepenuhan (puasa atau pra-makan)
Pemodelan dan Sintaks R?
Saya mencoba menentukan model lengkap yang sesuai dengan struktur rata-rata yang dimuat yang dapat digunakan sebagai titik awal dalam strategi pemilihan model top-down.
Masalah spesifik:
- Apakah sintaksis menentukan dengan benar efek pengelompokan dan acak?
- Selain sintaks, apakah model ini sesuai untuk desain dalam-subjek di atas?
- Haruskah model lengkap menentukan semua interaksi efek tetap, atau hanya interaksi yang benar-benar saya minati?
- Saya belum memasukkan faktor STIM dalam model, yang mencirikan jenis stimulus spesifik yang digunakan dalam percobaan, tetapi yang saya tidak tertarik untuk memperkirakannya dengan cara apa pun - haruskah saya menentukan bahwa sebagai faktor acak mengingat faktor STIM memiliki 123 level dan sangat sedikit titik data per jenis stimulus?
Jawaban:
Saya akan menjawab setiap pertanyaan Anda secara bergantian.
Apakah sintaksis menentukan dengan benar efek pengelompokan dan acak?
Model yang Anda muat di sini adalah, dalam istilah matematika, model
dimana
Sebagaimana dicatat pada halaman 14-15 di sini model ini benar untuk menentukan bahwa sesi bersarang dalam individu, yang merupakan kasus dari deskripsi Anda.
Selain sintaks, apakah model ini sesuai untuk desain dalam-subjek di atas?
Haruskah model lengkap menentukan semua interaksi efek tetap, atau hanya interaksi yang benar-benar saya minati?
Saya pikir memulai dengan model yang sangat jenuh mungkin bukan ide yang bagus, kecuali itu masuk akal secara substansial. Seperti yang saya katakan dalam komentar, ini akan cenderung melebihi set data khusus Anda dan dapat membuat hasil Anda kurang digeneralisasikan. Mengenai pemilihan model, jika Anda mulai dengan model yang benar-benar jenuh dan melakukan seleksi mundur ( yang oleh beberapa orang di situs ini, dengan alasan yang bagus, keberatan ) maka Anda harus memastikan untuk menghormati hierarki dalam model. Artinya, jika Anda menghilangkan interaksi tingkat yang lebih rendah dari model, maka Anda juga harus menghapus semua interaksi tingkat yang lebih tinggi yang melibatkan variabel itu. Untuk diskusi lebih lanjut tentang itu, lihat utas tertaut.
Saya belum memasukkan faktor STIM dalam model, yang mencirikan jenis stimulus spesifik yang digunakan dalam percobaan, tetapi yang saya tidak tertarik untuk memperkirakannya dengan cara apa pun - haruskah saya menentukan bahwa sebagai faktor acak mengingat faktor STIM memiliki 123 level dan sangat sedikit titik data per jenis stimulus?
Diakui tidak tahu apa-apa tentang aplikasi (jadi ambil ini dengan sebutir garam), yang terdengar seperti efek tetap, bukan efek acak. Artinya, jenis perawatan terdengar seperti variabel yang akan sesuai dengan perubahan tetap dalam respon rata-rata, bukan sesuatu yang akan menginduksi korelasi antara subyek yang memiliki jenis stimulus yang sama. Tapi, fakta bahwa itu adalah faktor level 123 membuatnya sulit untuk masuk ke dalam model. Saya kira saya ingin tahu seberapa besar efek yang Anda harapkan dari efek ini. Terlepas dari ukuran efeknya, itu tidak akan menyebabkan bias dalam perkiraan kemiringan Anda karena ini adalah model linier, tetapi meninggalkannya dapat membuat kesalahan standar Anda lebih besar daripada yang seharusnya.
sumber