Saya melakukan percobaan di mana saya membesarkan keluarga yang berbeda yang berasal dari dua populasi sumber yang berbeda. Setiap keluarga diberi satu dari dua perawatan. Setelah percobaan saya mengukur beberapa sifat pada setiap individu. Untuk menguji efek dari salah satu perlakuan atau sumber serta interaksi mereka, saya menggunakan model efek campuran linier dengan keluarga sebagai faktor acak, yaitu
lme(fixed=Trait~Treatment*Source,random=~1|Family,method="ML")
sejauh ini bagus, Sekarang saya harus menghitung komponen varians relatif, yaitu persentase variasi yang dijelaskan oleh perlakuan atau sumber serta interaksi.
Tanpa efek acak, saya dapat dengan mudah menggunakan jumlah kuadrat (SS) untuk menghitung varians yang dijelaskan oleh masing-masing faktor. Tetapi untuk model campuran (dengan estimasi ML), tidak ada SS, maka saya pikir saya bisa menggunakan Pengobatan dan Sumber sebagai efek acak juga untuk memperkirakan varians, yaitu
lme(fixed=Trait~1,random=~(Treatment*Source)|Family, method="REML")
Namun, dalam beberapa kasus, lme tidak konvergen, maka saya menggunakan lmer dari paket lme4:
lmer(Trait~1+(Treatment*Source|Family),data=DATA)
Di mana saya mengekstrak varians dari model menggunakan fungsi ringkasan:
model<-lmer(Trait~1+(Treatment*Source|Family),data=regrexpdat)
results<-VarCorr(model)
variances<-results[,3]
Saya mendapatkan nilai yang sama dengan fungsi VarCorr. Saya kemudian menggunakan nilai-nilai ini untuk menghitung persentase aktual dari variasi mengambil jumlah sebagai variasi total.
Di mana saya berjuang adalah dengan interpretasi hasil dari model lme awal (dengan pengobatan dan sumber sebagai efek tetap) dan model acak untuk memperkirakan komponen varians (dengan perlakuan dan sumber sebagai efek acak). Saya menemukan dalam kebanyakan kasus bahwa persentase perbedaan yang dijelaskan oleh masing-masing faktor tidak sesuai dengan signifikansi dari efek tetap.
Misalnya untuk sifat HD, lme awal menunjukkan kecenderungan untuk interaksi serta pentingnya pengobatan. Menggunakan prosedur mundur, saya menemukan bahwa Pengobatan memiliki kecenderungan yang signifikan. Namun, memperkirakan komponen varians, saya menemukan bahwa Sumber memiliki varian tertinggi, membuat hingga 26,7% dari total varian.
Lme:
anova(lme(fixed=HD~as.factor(Treatment)*as.factor(Source),random=~1|as.factor(Family),method="ML",data=test),type="m")
numDF denDF F-value p-value
(Intercept) 1 426 0.044523 0.8330
as.factor(Treatment) 1 426 5.935189 0.0153
as.factor(Source) 1 11 0.042662 0.8401
as.factor(Treatment):as.factor(Source) 1 426 3.754112 0.0533
Dan si lemah:
summary(lmer(HD~1+(as.factor(Treatment)*as.factor(Source)|Family),data=regrexpdat))
Linear mixed model fit by REML
Formula: HD ~ 1 + (as.factor(Treatment) * as.factor(Source) | Family)
Data: regrexpdat
AIC BIC logLik deviance REMLdev
-103.5 -54.43 63.75 -132.5 -127.5
Random effects:
Groups Name Variance Std.Dev. Corr
Family (Intercept) 0.0113276 0.106431
as.factor(Treatment) 0.0063710 0.079819 0.405
as.factor(Source) 0.0235294 0.153393 -0.134 -0.157
as.factor(Treatment)L:as.factor(Source) 0.0076353 0.087380 -0.578 -0.589 -0.585
Residual 0.0394610 0.198648
Number of obs: 441, groups: Family, 13
Fixed effects:
Estimate Std. Error t value
(Intercept) -0.02740 0.03237 -0.846
Maka pertanyaan saya adalah, apakah benar apa yang saya lakukan? Atau haruskah saya menggunakan cara lain untuk memperkirakan jumlah varians yang dijelaskan oleh masing-masing faktor (yaitu Pengobatan, Sumber dan interaksinya). Misalnya, apakah ukuran efek akan menjadi cara yang lebih tepat?
Jawaban:
Salah satu cara umum untuk menentukan kontribusi relatif dari masing-masing faktor ke model adalah dengan menghapus faktor dan membandingkan kemungkinan relatif dengan sesuatu seperti tes chi-squared:
Karena cara menghitung kemungkinan antara fungsi mungkin sedikit berbeda, saya biasanya hanya akan membandingkannya antara metode yang sama.
sumber
1-pchisq(logLik(model1) - logLik(model2), 1)
?