Saya telah melihat ikhtisar rumus lm / lmer R oleh @conjugateprior dan bingung dengan entri berikut:
Sekarang asumsikan A adalah acak, tetapi B adalah tetap dan B bersarang dalam A.
aov(Y ~ B + Error(A/B), data=d)
Formula model campuran analog di bawah lmer(Y ~ B + (1 | A:B), data=d)
ini disediakan untuk kasus yang sama.
Saya tidak begitu mengerti apa artinya. Dalam percobaan di mana subjek dibagi menjadi beberapa kelompok, kita akan memiliki faktor acak (subjek) bersarang dalam faktor tetap (kelompok). Tetapi bagaimana suatu faktor tetap dapat bersarang dalam faktor acak? Sesuatu yang diperbaiki bersarang dalam subjek acak? Apakah itu mungkin? Jika tidak memungkinkan, apakah rumus R ini masuk akal?
Ikhtisar ini disebutkan akan sebagian didasarkan pada halaman kepribadian-proyek melakukan ANOVA di R berdasarkan diri pada ini tutorial langkah-langkah diulang dalam R . Ada contoh berikut untuk langkah-langkah yang diulang ANOVA diberikan:
aov(Recall ~ Valence + Error(Subject/Valence), data.ex3)
Di sini subjek disajikan dengan kata-kata valensi yang berbeda-beda (faktor dengan tiga level) dan waktu mengingatnya diukur. Setiap subjek disajikan dengan kata-kata dari ketiga level valensi. Saya tidak melihat apa pun yang bersarang di desain ini (tampaknya dilintasi, sesuai jawaban yang bagus di sini ), dan saya akan dengan naif berpikir bahwa Error(Subject)
atau (1 | Subject)
harus istilah acak yang sesuai dalam kasus ini. The Subject/Valence
"bersarang" (?) Membingungkan.
Perhatikan bahwa saya mengerti itu Valence
adalah faktor dalam-subjek . Tapi saya pikir itu bukan faktor "bersarang" dalam subjek (karena semua subjek mengalami ketiga level Valence
).
Memperbarui. Saya mengeksplorasi pertanyaan pada CV tentang mengkode tindakan ANOVA yang berulang di R.
Di sini berikut ini digunakan untuk tetap dalam-subjek / tindakan-berulang A dan acak
subject
:summary(aov(Y ~ A + Error(subject/A), data = d)) anova(lme(Y ~ A, random = ~1|subject, data = d))
Di sini untuk dua efek A-B / subjek yang diulang / diulang-ulang:
summary(aov(Y ~ A*B + Error(subject/(A*B)), data=d)) lmer(Y ~ A*B + (1|subject) + (1|A:subject) + (1|B:subject), data=d)
Di sini untuk tiga efek dalam-subjek A, B, dan C:
summary(aov(Y ~ A*B*C + Error(subject/(A*B*C)), data=d)) lmer(Y ~ A*B*C + (1|subject) + (0+A|subject) + (0+B|subject) + (0+C|subject) + (0+A:B|subject) + (0+A:C|subject) + (0+B:C|subject), data = d)
Pertanyaan saya:
- Kenapa
Error(subject/A)
dan tidakError(subject)
? - Apakah itu
(1|subject)
atau(1|subject)+(1|A:subject)
atau hanya(1|A:subject)
? - Apakah itu
(1|subject) + (1|A:subject)
atau(1|subject) + (0+A|subject)
, dan mengapa tidak sederhana(A|subject)
?
Pada saat ini saya telah melihat beberapa utas yang mengklaim bahwa beberapa hal ini setara (misalnya, yang pertama: klaim bahwa mereka sama tetapi klaim yang berlawanan pada SO ; yang ketiga: jenis klaim bahwa mereka sama ). Apakah mereka?
sumber
subject/condition
, ini secara konsep meragukan karena tampaknya menyarankan bahwa kondisi bersarang pada subjek, ketika jelas itu kebalikannya, tetapi model yang benar-benar cocok adalahsubject + subject:condition
, yang merupakan model yang benar-benar valid dengan efek subjek acak dan lereng X subjek acak.lm
danaov
formula? Jika saya ingin memiliki sumber yang berwenang tentang apa sebenarnya yangaov
dilakukan (apakah ini pembungkuslm
?) Dan bagaimanaError()
istilah tersebut bekerja, di mana saya harus mencari?aov
adalah pembungkus untuklm
dalam arti yanglm
digunakan untuk kotak paling cocok, tetapiaov
melakukan beberapa pekerjaan tambahan (terutama, menerjemahkanError
istilah untuklm
). Sumber otoritatif adalah kode sumber atau mungkin referensi yang diberikan dalamhelp("aov")
: Chambers et al (1992). Tetapi saya tidak memiliki akses ke referensi itu, jadi saya akan melihat ke dalam kode sumber.Jawaban:
Dalam model campuran, pengobatan faktor-faktor sebagai tetap atau acak, terutama dalam hubungannya dengan apakah mereka dilintasi, sebagian dilintasi atau disarang dapat menyebabkan banyak kebingungan. Juga, tampaknya ada perbedaan dalam terminologi antara apa yang dimaksud dengan bersarang di dunia anova / eksperimen yang dirancang dan dunia model campuran / multilevel.
Saya tidak mengaku tahu semua jawaban, dan jawaban saya tidak akan lengkap (dan dapat menghasilkan pertanyaan lebih lanjut) tetapi saya akan mencoba untuk mengatasi beberapa masalah di sini:
(judul pertanyaan)
Tidak, saya tidak percaya ini masuk akal. Ketika kita berhadapan dengan tindakan berulang, maka biasanya apa pun masalahnya tindakan itu diulangi akan acak, sebut saja
Subject
, danlme4
kita akan ingin memasukkanSubject
di sisi kanan satu atau lebih|
di bagian acak dari rumus. Jika kita memiliki efek acak lainnya, maka ini dapat dilintasi, sebagian dilintasi atau disarangkan - dan jawaban saya untuk pertanyaan ini mengatasinya.Masalah dengan eksperimen yang dirancang dengan tipe anova ini tampaknya adalah bagaimana menangani faktor-faktor yang biasanya dianggap telah diperbaiki, dalam situasi tindakan berulang, dan pertanyaan-pertanyaan dalam tubuh OP berbicara tentang ini:
Saya biasanya tidak menggunakan
aov()
sehingga saya bisa kehilangan sesuatu tetapi, bagi sayaError(subject/A)
itu sangat menyesatkan dalam kasus pertanyaan terkait .Error(subject)
sebenarnya mengarah ke hasil yang persis sama.Ini berkaitan dengan pertanyaan ini . Dalam hal ini, semua formulasi efek acak berikut mengarah ke hasil yang sama persis:
Namun, ini karena dataset simulasi dalam pertanyaan tidak memiliki variasi dalam apa pun, hanya dibuat dengan
Y = rnorm(48)
. Jika kita mengambil dataset nyata seperticake
dataset dalamlme4
, kami menemukan bahwa ini umumnya tidak akan terjadi. Dari dokumentasi, berikut adalah pengaturan eksperimental:Jadi, kami telah mengulangi langkah-langkah di dalam
replicate
, dan kami juga tertarik pada faktorrecipe
- faktor tetap dantemperature
(kami dapat mengabaikantemp
karena ini hanya pengkodean yang berbedatemperature
), dan kami dapat memvisualisasikan situasi menggunakanxtabs
:Jika
recipe
itu adalah efek acak, kami akan mengatakan bahwa ini adalah efek acak berpotongan. Tidak mungkinrecipe A
milikreplicate 1
atau replikasi lainnya.Demikian pula untuk
temp
.Jadi model pertama yang mungkin cocok adalah:
Ini akan memperlakukan masing-masing
replicate
sebagai satu-satunya sumber variasi acak (selain residu tentu saja). Tetapi mungkin ada perbedaan acak antara resep. Jadi kita mungkin tergoda untuk memasukkanrecipe
sebagai efek acak (silang) lain tetapi itu akan keliru karena kita hanya memiliki 3 levelrecipe
sehingga kita tidak dapat mengharapkan model untuk memperkirakan komponen varians dengan baik. Jadi, sebagai gantinya kita dapat menggunakanreplicate:recipe
sebagai variabel pengelompokan yang akan memungkinkan kita untuk memperlakukan setiap kombinasi replikasi dan resep sebagai faktor pengelompokan yang terpisah. Jadi sedangkan dengan model di atas kita akan memiliki 15 intersep acak untuk levelreplicate
kita sekarang akan memiliki 45 intersep acak untuk masing-masing kombinasi yang terpisah:Perhatikan bahwa kami sekarang memiliki (sangat sedikit) hasil yang berbeda yang menunjukkan bahwa ada beberapa variabilitas acak karena resep, tetapi tidak banyak.
Kita juga bisa melakukan hal yang sama
temperature
.Sekarang, kembali ke pertanyaan Anda, Anda juga bertanya
Saya tidak sepenuhnya yakin dari mana ini (menggunakan lereng acak) berasal - sepertinya tidak muncul dalam 2 pertanyaan terkait - tetapi masalah saya
(1|subject) + (1|A:subject)
adalah bahwa ini persis sama dengan(1|subject/A)
yang berartiA
bersarang di dalamsubject
, yang pada turn berarti (bagi saya) bahwa setiap levelA
terjadi dalam 1 dan hanya 1 levelsubject
yang jelas tidak terjadi di sini.Saya mungkin akan menambah dan / atau mengedit jawaban ini setelah saya memikirkannya lagi, tetapi saya ingin mendapatkan pemikiran awal saya.
sumber
cake
dataset. Tampaknya replikasi bersarang dalam resep; alasannyaxtabs
tidak menunjukkannya persis alasan yang Anda jelaskan dalam jawaban bersarang-vs-silang: replikasi dikodekan sebagai 1-15 dan bukan sebagai 1-45. Untuk setiap resep, 15 "replikasi" dibuat dengan 6 kue; setiap kue kemudian dipanggang pada suhu yang berbeda. Jadi resep adalah faktor di antara subjek dan suhu adalah faktor di dalam subjek. Jadi menurut jawaban Anda itu, seharusnya(1|recipe/replicate)
. Tidak?(1|replicate:recipe)
mungkin setara.cake
hanya pada satu resep. Mengenai poin ketiga yang Anda katakan tidak yakin dari mana asalnya, silakan lihat tautan terakhir di Q saya, dengan contoh tiga faktor dalam-subjek. Lihat juga komentar Jake yang diputuskan di bawah Q ini, di mana ia menyebutkan lereng acak.aov
Anda benar bahwa tampaknyaError(subject/A)
danError(subject)
menghasilkan hasil yang sama jika tidak ada faktor lain, tetapi ambil contoh dari utas terkait dengan dua faktor, dan adaError(subject/(A*B))
danError(subject)
tidak setara. Pemahaman saya saat ini adalah karena yang pertama termasuk lereng acak.cake
dataset itu bukan contoh kerja yang baik. Permintaan maaf saya. Saya akan melihat sedikit lebih dalam ke dalamnya dan mungkin mencoba mencari yang lebih baik untuk ilustrasi.Ooooops. Komentator lansiran telah melihat bahwa posting saya penuh dengan omong kosong. Saya bingung desain bersarang dan desain ukuran berulang.
Situs ini memberikan rincian yang berguna tentang perbedaan antara desain tindakan bersarang dan berulang. Menariknya, penulis menunjukkan kuadrat rata-rata yang diharapkan untuk diperbaiki di dalam tetap, acak di dalam tetap dan acak di acak - tetapi tidak tetap dalam acak. Sulit membayangkan apa artinya itu - jika faktor-faktor di tingkat A dipilih secara acak, maka keacakan sekarang mengatur pemilihan faktor-faktor tingkat B. Jika 5 sekolah dipilih secara acak dari dewan sekolah, dan kemudian 3 guru dipilih dipilih dari masing-masing sekolah (guru bersarang di sekolah), tingkat faktor "guru" sekarang merupakan pemilihan acak guru dari dewan sekolah berdasarkan pemilihan sekolah secara acak. Saya tidak dapat "memperbaiki" guru yang akan saya miliki dalam percobaan.
sumber