Saya menganalisis hasil percobaan waktu reaksi dalam R.
Saya menjalankan pengukuran ANOVA berulang (1 faktor dalam subjek dengan 2 level dan 1 antara faktor subjek dengan 2 level). Saya menjalankan model campuran linear yang sama dan saya ingin meringkas hasil lmer dalam bentuk tabel ANOVA menggunakan lmerTest::anova
.
Jangan salah paham: Saya tidak mengharapkan hasil yang sama, namun saya tidak yakin tentang tingkat kebebasan dalam lmerTest::anova
hasil. Menurut saya ini agak mencerminkan ANOVA tanpa agregasi pada tingkat subjek.
Saya menyadari fakta bahwa menghitung derajat kebebasan dalam model efek campuran itu rumit, tetapi lmerTest::anova
disebutkan sebagai salah satu solusi yang mungkin dalam ?pvalues
topik yang diperbarui ( lme4
paket).
Apakah perhitungan ini benar? Apakah hasil lmerTest::anova
mencerminkan model yang ditentukan dengan benar?
Pembaruan: Saya membuat perbedaan individu lebih besar. Tingkat kebebasan dalam lmerTest::anova
lebih berbeda dari anova sederhana, tetapi saya masih tidak yakin, mengapa mereka begitu besar untuk faktor / interaksi dalam subjek.
# mini example with ANT dataset from ez package
library(ez); library(lme4); library(lmerTest)
# repeated measures ANOVA with ez package
data(ANT)
ANT.2 <- subset(ANT, !error)
# update: make individual differences larger
baseline.shift <- rnorm(length(unique(ANT.2$subnum)), 0, 50)
ANT.2$rt <- ANT.2$rt + baseline.shift[as.numeric(ANT.2$subnum)]
anova.ez <- ezANOVA(data = ANT.2, dv = .(rt), wid = .(subnum),
within = .(direction), between = .(group))
anova.ez
# similarly with lmer and lmerTest::anova
model <- lmer(rt ~ group * direction + (1 | subnum), data = ANT.2)
lmerTest::anova(model)
# simple ANOVA on all available data
m <- lm(rt ~ group * direction, data = ANT.2)
anova(m)
Hasil dari kode di atas [ diperbarui ]:
anova.ez
$ ANOVA
Effect DFn DFd F p p<.05 ges
2 group 1 18 2.6854464 0.11862957 0.1294475137
3 direction 1 18 0.9160571 0.35119193 0.0001690471
4 group:direction 1 18 4.9169156 0.03970473 * 0.0009066868
lmerTest :: anova (model)
Analysis of Variance Table of type 3 with Satterthwaite
approximation for degrees of freedom
Df Sum Sq Mean Sq F value Denom Pr(>F)
group 1 13293 13293 2.6830 18 0.1188
direction 1 1946 1946 0.3935 5169 0.5305
group:direction 1 11563 11563 2.3321 5169 0.1268
anova (m)
Analysis of Variance Table
Response: rt
Df Sum Sq Mean Sq F value Pr(>F)
group 1 1791568 1791568 242.3094 <2e-16 ***
direction 1 728 728 0.0985 0.7537
group:direction 1 12024 12024 1.6262 0.2023
Residuals 5187 38351225 7394
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
sumber
ezAnova
peringatan tersebut karena Anda tidak boleh menjalankan 2x2 anova jika sebenarnya data Anda berasal dari desain 2x2x2.ez
bisa diucapkan ulang; sebenarnya memiliki dua bagian yang penting: (1) bahwa data sedang dikumpulkan dan (2) hal-hal tentang desain parsial. # 1 paling relevan dengan perbedaan karena menjelaskan bahwa untuk melakukan anova non-efek campuran tradisional, seseorang harus mengumpulkan data ke pengamatan tunggal per sel desain. Dalam hal ini, kami ingin satu pengamatan per subjek per level variabel "arah" (sambil mempertahankan label grup untuk subjek). ezANOVA menghitung ini secara otomatis.summary(aov(rt ~ group*direction + Error(subnum/direction), data=ANT.2))
dan memberi 16 (?) Dfs untukgroup
dan 18 untukdirection
dangroup:direction
. Fakta bahwa ada ~ 125 pengamatan per kelompok / kombinasi arah cukup banyak tidak relevan untuk RM-ANOVA, lihat misalnya stats.stackexchange.com/questions/questions/286280 saya sendiri : arah diuji, bisa dikatakan, terhadap subjek- interaksi arah.lmerTest
perkiraan itu ~ 125 dfs.lmerTest::anova(model2, ddf="Kenward-Roger")
mengembalikan 18.000 df untukgroup
dan17.987
df untuk dua faktor lainnya, yang sangat sesuai dengan RM-ANOVA (sesuai ezAnova). Kesimpulan saya adalah bahwa perkiraan Satterthwaite gagalmodel2
karena suatu alasan.Saya biasanya setuju dengan analisis Ben, tetapi izinkan saya menambahkan beberapa komentar dan sedikit intuisi.
Pertama, hasil keseluruhan:
Ben menguraikan desain yang
subnum
bersaranggroup
sementaradirection
dangroup:direction
disilangkansubnum
. Ini berarti bahwa istilah kesalahan alami (yaitu yang disebut "melampirkan kesalahan strata") untukgroup
adalahsubnum
sedangkan strata kesalahan melampirkan untuk istilah lain (termasuksubnum
) adalah residual.Struktur ini dapat direpresentasikan dalam diagram struktur-faktor:
Di sini istilah acak terlampir dalam tanda kurung,
0
mewakili keseluruhan rata-rata (atau mencegat),[I]
mewakili istilah kesalahan, angka super-skrip adalah jumlah level dan nomor sub-skrip adalah jumlah derajat kebebasan dengan asumsi desain seimbang. Diagram menunjukkan bahwa istilah kesalahan alami (melampirkan strata kesalahan) untukgroup
adalahsubnum
dan pembilang df untuksubnum
, yang sama dengan penyebut df untukgroup
, adalah 18: 20 dikurangi 1 df untukgroup
dan 1 df untuk rata-rata keseluruhan. Pengantar yang lebih komprehensif untuk diagram struktur faktor tersedia di bab 2 di sini: https://02429.compute.dtu.dk/eBook .Jika data benar-benar seimbang, kami akan dapat membuat uji-F dari dekomposisi SSQ seperti yang disediakan oleh
anova.lm
. Karena dataset sangat seimbang, kami dapat memperoleh perkiraan F-tes sebagai berikut:Di sini semua nilai F dan p dihitung dengan asumsi bahwa semua istilah memiliki residual sebagai strata kesalahan terlampirnya, dan itu berlaku untuk semua kecuali 'grup'. Sebaliknya, F -test 'seimbang-benar' untuk grup adalah:
di mana kita menggunakan
subnum
MS sebagai gantiResiduals
MS dalam penyebut nilai- F .Perhatikan bahwa nilai-nilai ini sangat cocok dengan hasil Satterthwaite:
Perbedaan yang tersisa disebabkan oleh data yang tidak seimbang.
OP membandingkan
anova.lm
dengananova.lmerModLmerTest
, yang ok, tetapi untuk membandingkan suka dengan seperti kita harus menggunakan kontras yang sama. Dalam hal ini ada perbedaan antaraanova.lm
dananova.lmerModLmerTest
karena mereka menghasilkan tes Tipe I dan III secara default masing-masing, dan untuk dataset ini terdapat perbedaan (kecil) antara kontras Tipe I dan III:Jika set data benar-benar seimbang, kontras tipe I akan sama dengan kontras tipe III (yang tidak terpengaruh oleh jumlah sampel yang diamati).
Satu komentar terakhir adalah bahwa 'kelambatan' dari metode Kenward-Roger bukan karena model pemasangan kembali, tetapi karena melibatkan perhitungan dengan matriks varians-kovarians marginal dari pengamatan / residu (5191x5191 dalam kasus ini) yang tidak kasus untuk metode Satterthwaite.
Mengenai model2
Adapun model2 situasinya menjadi lebih kompleks dan saya pikir lebih mudah untuk memulai diskusi dengan model lain di mana saya telah memasukkan interaksi 'klasik' antara
subnum
dandirection
:Karena varians yang terkait dengan interaksi pada dasarnya nol (dengan adanya
subnum
efek utama acak), istilah interaksi tidak berpengaruh pada perhitungan derajat kebebasan, nilai- F dan nilai- p :Namun,
subnum:direction
adalah strata kesalahan melampirkan untuksubnum
jadi jika kita menghapussubnum
semua SSQ terkait kembali kesubnum:direction
Sekarang istilah kesalahan alami untuk
group
,direction
dangroup:direction
adalahsubnum:direction
dan dengannlevels(with(ANT.2, subnum:direction))
= 40 dan empat parameter, derajat kebebasan penyebut untuk istilah-istilah tersebut seharusnya sekitar 36:Ini F -tests juga dapat didekati dengan 'seimbang-benar' F -tests:
sekarang beralih ke model2:
Model ini menggambarkan struktur kovarians efek-acak yang agak rumit dengan matriks varians-kovarians 2x2. Parameterisasi default tidak mudah untuk ditangani dan kami lebih baik dengan parameterisasi ulang model:
Jika kita membandingkan
model2
denganmodel4
, mereka memiliki sama banyak acak-efek; 2 untuk masing-masingsubnum
, yaitu 2 * 20 = 40 total. Sementaramodel4
menetapkan parameter varians tunggal untuk semua 40 efek acak,model2
menetapkan bahwa setiapsubnum
pasangan efek acak memiliki distribusi normal bi-variate dengan matriks varians-kovarians 2x2 yang parameternya diberikan olehIni menunjukkan terlalu pas, tapi mari kita simpan itu untuk hari lain. Yang penting di sini adalah bahwa
model4
adalah kasus khususmodel2
dan yangmodel
adalah juga kasus khusus darimodel2
. Berbicara secara longgar (dan secara intuitif)(direction | subnum)
mengandung atau menangkap variasi yang terkait dengan efek utamasubnum
serta interaksidirection:subnum
. Dalam hal efek acak kita dapat menganggap dua efek atau struktur ini sebagai menangkap variasi antara baris dan baris-demi-kolom masing-masing:Dalam hal ini, perkiraan efek acak ini serta estimasi parameter varians keduanya menunjukkan bahwa kami benar-benar hanya memiliki efek utama acak
subnum
(variasi antara baris) yang ada di sini. Apa yang menyebabkan semua ini adalah bahwa tingkat kebebasan Denominate Satterthwaite masukadalah kompromi antara efek-utama dan struktur interaksi ini: Kelompok DenDF tetap di 18 (bersarang
subnum
oleh desain) tetapidirection
dangroup:direction
DenDF adalah kompromi antara 36 (model4
) dan 5169 (model
).Saya tidak berpikir apa pun di sini menunjukkan bahwa perkiraan Satterthwaite (atau implementasinya di lmerTest ) salah.
Tabel setara dengan metode Kenward-Roger memberi
Tidak mengherankan bahwa KR dan Satterthwaite dapat berbeda tetapi untuk semua tujuan praktis perbedaan dalam nilai- p adalah kecil. Analisis saya di atas menunjukkan bahwa
DenDF
untukdirection
dangroup:direction
tidak boleh lebih kecil dari ~ 36 dan mungkin lebih besar dari yang diberikan bahwa kita pada dasarnya hanya memiliki efek utama acakdirection
saat ini, jadi jika saya pikir ini merupakan indikasi bahwa metode KR mendapatkanDenDF
terlalu rendah pada kasus ini. Tetapi perlu diingat bahwa data tidak benar-benar mendukung(group | direction)
struktur sehingga perbandingannya sedikit buatan - akan lebih menarik jika model tersebut benar-benar didukung.sumber
model3
. Namun, ini digunakansubnum:direction
sebagai istilah kesalahan untuk pengujiandirection
. Sedangkan di sini Anda dapat memaksa ini terjadi hanya dengan mengecualikan(1|subnum)
seperti padamodel4
. Mengapa? (2b) Juga, RM-ANOVA menghasilkan df = 18 untukdirection
, bukan 36 saat Anda masukmodel4
. Mengapa?summary(aov(rt ~ group*direction + Error(subnum/direction), data=ANT.2))
.subnum
dansubnum:direction
tidak nol makaanova(lm(rt2 ~ group * direction + subnum + subnum:direction, data = ANT.2))
memberikan 18 df untuk ketiga faktor dan ini adalah apa yang dijemput metode KR. Ini dapat dilihat dimodel3
mana KR memberikan desain berbasis 18 df untuk semua istilah bahkan ketika varians interaksi adalah nol sedangkan Satterthwaite mengenali istilah varians menghilang dan menyesuaikan df sesuai ....