Pertanyaan saya adalah sangat erat kaitannya dengan posting sebelumnya Menentukan Kesalahan () istilah dalam tindakan berulang ANOVA di R . Namun, saya ingin mendapatkan lebih banyak wawasan tentang cara mendefinisikan istilah kesalahan.
Misalkan saya memiliki ANOVA dua arah yang diulang, Faktor untuk antara efek kelompok adalah Pengobatan (kontrol vs plasebo), sedangkan Waktu adalah efek dalam kelompok yang diukur berulang kali lebih dari 4 kali (T1 ~ T4). ID Pasien dicatat sebagai Subjek. Di sini saya meminjam data dari contoh dari tutorial di http://gjkerns.github.io/R/2012/01/20/power-sample-size.html sehingga data terlihat seperti ini
Time Subject Method NDI
0min 1 Treat 51.01078
15min 1 Treat 47.12314
48hrs 1 Treat 26.63542
96hrs 1 Treat 20.78196
0min 2 Treat 42.61345
15min 2 Treat 32.77171
Untuk menerapkan ANOVA:
aovComp <- aov(NDI ~ Time*Method + Error(Subject/Time), theData)
summary(aovComp)
Error: Subject
Df Sum Sq Mean Sq F value Pr(>F)
Method 1 113 112.7 0.481 0.491
Residuals 58 13579 234.1
Error: Subject:Time
Df Sum Sq Mean Sq F value Pr(>F)
Time 3 13963 4654 103.789 < 2e-16 ***
Time:Method 3 1221 407 9.074 1.3e-05 ***
Residuals 174 7803 45
Saya juga mencoba istilah kesalahan lainnya:
aovComp1 <- aov(NDI ~ Time*Method + Error(Subject), theData)
summary(aovComp1)
Error: Subject
Df Sum Sq Mean Sq F value Pr(>F)
Method 1 113 112.7 0.481 0.491
Residuals 58 13579 234.1
Error: Within
Df Sum Sq Mean Sq F value Pr(>F)
Time 3 13963 4654 103.789 < 2e-16 ***
Time:Method 3 1221 407 9.074 1.3e-05 ***
Residuals 174 7803 45
Dapatkah seseorang membantu saya menjelaskan perbedaan antara dua istilah kesalahan ini? Jika istilah pertama adalah yang benar, apa artinya hasil dari istilah kesalahan kedua?
Pembaruan oleh @amoeba: Dua output sama sehingga tampaknya dalam hal ini tidak ada perbedaan, tetapi pertanyaannya tetap tentang apa perbedaan prinsipnya . Apakah Error(subject)
dan Error(subject/time)
selalu hal yang sama?
sumber
time
), makaError(subject)
danError(subject/time)
akan menghasilkan nilai F dan p yang berbeda untuktime
.Jawaban:
Pertama,
subject/time
adalah notasi untuktime
bersarangsubject
, dan berkembang menjadi dua bagian,subject
dansubject:time
interaksi. Jadi pertanyaannya menjadi lebih tepat, kapan kita harus menentukansubject:time
interaksi, dan apa bedanya?Sebelum menjawab pertanyaan ini, satu hal penting lainnya yang harus disadari adalah bahwa semua model menyertakan satu istilah kesalahan tambahan yang tidak perlu ditentukan, yang merupakan istilah kesalahan yang terkait dengan pengukuran individu (tingkat terendah, jika Anda memikirkannya secara hierarkis).
Dalam hal ini,
subject:time
interaksinya adalah level terendah, yang selalu termasuk dalam model. Jadi menggunakanError(subject)
danError(subject/time)
memberikan hasil yang sama; satu-satunya perbedaan adalah bahwa dalam output, tingkat hasil dipanggilWithin
untuk yang pertama dan dipanggilsubject:time
untuk yang kedua.Namun, dalam kasus di mana ada beberapa pengukuran pada setiap
subject/time
kombinasi, perlu untuk menentukansubject:time
interaksi, karena interaksi itu tidak pada tingkat terendah.sumber
subject/time
kombinasi, mengapa kita perlu ingin menguji efektime
relatif terhadapsubject:time
interaksi? Ini pada dasarnya adalah isi dari pertanyaan saya di sini stats.stackexchange.com/questions/286280 , jadi saya akan mengundang pembaca masa depan dari utas ini untuk mencari pembenaran konseptual di sana.