Kita tahu bahwa uji- t berpasangan hanyalah kasus khusus dari ANOVA langkah-langkah berulang satu arah (atau dalam subjek) serta model efek campuran linier, yang dapat ditunjukkan dengan fungsi lme () yang berfungsi sebagai paket nlme dalam R seperti yang ditunjukkan di bawah ini.
#response data from 10 subjects under two conditions
x1<-rnorm(10)
x2<-1+rnorm(10)
# Now create a dataframe for lme
myDat <- data.frame(c(x1,x2), c(rep("x1", 10), rep("x2", 10)), rep(paste("S", seq(1,10), sep=""), 2))
names(myDat) <- c("y", "x", "subj")
Ketika saya menjalankan uji-t berpasangan berikut:
t.test(x1, x2, paired = TRUE)
Saya mendapat hasil ini (Anda akan mendapatkan hasil yang berbeda karena generator acak):
t = -2.3056, df = 9, p-value = 0.04657
Dengan pendekatan ANOVA kita bisa mendapatkan hasil yang sama:
summary(aov(y ~ x + Error(subj/x), myDat))
# the F-value below is just the square of the t-value from paired t-test:
Df F value Pr(>F)
x 1 5.3158 0.04657
Sekarang saya dapat memperoleh hasil yang sama dalam lme dengan model berikut, dengan asumsi matriks korelasi simetris positif-pasti untuk dua kondisi:
summary(fm1 <- lme(y ~ x, random=list(subj=pdSymm(form=~x-1)), data=myDat))
# the 2nd row in the following agrees with the paired t-test
# (Intercept) -0.2488202 0.3142115 9 -0.7918878 0.4488
# xx2 1.3325786 0.5779727 9 2.3056084 0.0466
Atau model lain, dengan asumsi simetri gabungan untuk matriks korelasi dua kondisi:
summary(fm2 <- lme(y ~ x, random=list(subj=pdCompSymm(form=~x-1)), data=myDat))
# the 2nd row in the following agrees with the paired t-test
# (Intercept) -0.2488202 0.4023431 9 -0.618428 0.5516
# xx2 1.3325786 0.5779727 9 2.305608 0.0466
Dengan uji-t berpasangan dan ANOVA pengukuran berulang satu arah, saya dapat menuliskan model rata-rata sel tradisional sebagai
Yij = μ + αi + βj + εij, i = 1, 2; j = 1, ..., 10
di mana i mengindeks kondisi, j indeks subjek, Y ij adalah variabel respon, μ konstan untuk efek tetap untuk rata-rata keseluruhan, α i adalah efek tetap untuk kondisi, β j adalah efek acak untuk subjek berikut N (0, σ hal 2 ) (σ hal 2 adalah varians populasi), dan ε ij adalah residual setelah N (0, σ 2 ) (σ 2 adalah varians dalam subjek).
Saya berpikir bahwa model sel rata-rata di atas tidak akan sesuai untuk model lme, tetapi masalahnya adalah bahwa saya tidak dapat datang dengan model yang masuk akal untuk pendekatan dua lme () dengan asumsi struktur korelasi. Alasannya adalah bahwa model lme tampaknya memiliki lebih banyak parameter untuk komponen acak daripada model rata-rata sel yang ditawarkan di atas. Setidaknya model lme memberikan nilai-F yang persis sama, derajat kebebasan, dan nilai-p juga, yang tidak bisa. Lebih khusus, gls memberikan DF yang salah karena fakta bahwa itu tidak menjelaskan fakta bahwa setiap subjek memiliki dua pengamatan, yang mengarah ke banyak DF yang meningkat. Model lme kemungkinan besar overparameter dalam menentukan efek acak, tapi saya tidak tahu apa modelnya dan apa parameternya. Jadi masalah ini masih belum terselesaikan bagi saya.
sumber
Jawaban:
Kesetaraan model dapat diamati dengan menghitung korelasi antara dua pengamatan dari individu yang sama, sebagai berikut:
Perhatikan bahwa model tersebut tidak cukup setara karena model efek acak memaksa korelasi menjadi positif. Model CS dan model t-test / anova tidak.
EDIT: Ada dua perbedaan lain juga. Pertama, CS dan model efek acak mengasumsikan normalitas untuk efek acak, tetapi model t-test / anova tidak. Kedua, CS dan model efek acak cocok menggunakan kemungkinan maksimum, sedangkan anova cocok menggunakan kotak rata-rata; ketika semuanya seimbang mereka akan setuju, tetapi tidak harus dalam situasi yang lebih kompleks. Akhirnya, saya akan berhati-hati dalam menggunakan nilai-nilai F / df / p dari berbagai kecocokan sebagai ukuran seberapa banyak model setuju; lihat screed terkenal Doug Bates di df untuk lebih jelasnya. (AKHIR EDIT)
Masalah dengan
R
kode Anda adalah Anda tidak menentukan struktur korelasi dengan benar. Anda perlu menggunakangls
dengancorCompSymm
struktur korelasi.Hasilkan data sehingga ada efek subjek:
Maka inilah bagaimana Anda akan cocok dengan efek acak dan model simetri gabungan.
Kesalahan standar dari model efek acak adalah:
Dan varians korelasi dan residual dari model CS adalah:
Dan mereka sama dengan apa yang diharapkan:
Struktur korelasi lainnya biasanya tidak cocok dengan efek acak tetapi hanya dengan menentukan struktur yang diinginkan; satu pengecualian umum adalah AR (1) + model efek acak, yang memiliki efek acak dan korelasi AR (1) antara pengamatan pada efek acak yang sama.
EDIT2: Ketika saya cocok dengan tiga opsi, saya mendapatkan hasil yang persis sama kecuali bahwa gls tidak mencoba menebak df untuk jangka waktu yang diinginkan.
(Intersepsi berbeda di sini karena dengan pengkodean default, ini bukan berarti semua subjek, tetapi rata-rata subjek pertama.)
Sangat menarik untuk dicatat bahwa
lme4
paket yang lebih baru memberikan hasil yang sama tetapi bahkan tidak mencoba untuk menghitung nilai p.sumber
Anda mungkin juga mempertimbangkan menggunakan fungsi
mixed
dalam paketafex
untuk mengembalikan nilai p dengan pendekatan Kenward-Roger df, yang mengembalikan nilai p identik sebagai uji t berpasangan:Atau
sumber