Pertanyaan utama saya adalah bagaimana menginterpretasikan output (koefisien, F, P) saat melakukan ANOVA Tipe I (berurutan)?
Masalah penelitian spesifik saya sedikit lebih kompleks, jadi saya akan memecah contoh saya menjadi beberapa bagian. Pertama, jika saya tertarik pada efek kepadatan laba-laba (X1) pada pertumbuhan tanaman (Y1) dan saya menanam bibit di kandang dan memanipulasi kepadatan laba-laba, maka saya dapat menganalisis data dengan ANOVA sederhana atau regresi linier. Maka tidak masalah jika saya menggunakan Tipe I, II, atau III Jumlah Kuadrat (SS) untuk ANOVA saya. Dalam kasus saya, saya memiliki 4 ulangan dari 5 tingkat kerapatan, jadi saya dapat menggunakan kerapatan sebagai faktor atau sebagai variabel kontinu. Dalam hal ini, saya lebih suka menafsirkannya sebagai variabel independen (prediktor) yang berkelanjutan. Di RI dapat menjalankan yang berikut:
lm1 <- lm(y1 ~ density, data = Ena)
summary(lm1)
anova(lm1)
Menjalankan fungsi anova akan masuk akal untuk perbandingan nanti, harap abaikan saja keanehannya di sini. Outputnya adalah:
Response: y1
Df Sum Sq Mean Sq F value Pr(>F)
density 1 0.48357 0.48357 3.4279 0.08058 .
Residuals 18 2.53920 0.14107
Sekarang, katakanlah saya menduga bahwa tingkat awal nitrogen anorganik dalam tanah, yang tidak dapat saya kendalikan, mungkin juga secara signifikan mempengaruhi pertumbuhan tanaman. Saya tidak terlalu tertarik dengan efek ini tetapi ingin memperhitungkan variasi yang disebabkannya. Sungguh, minat utama saya adalah pada efek kepadatan laba-laba (hipotesis: peningkatan kepadatan laba-laba menyebabkan peningkatan pertumbuhan tanaman - mungkin melalui pengurangan serangga herbivora tapi saya hanya menguji efeknya bukan mekanismenya). Saya bisa menambahkan efek N anorganik ke dalam analisis saya.
Demi pertanyaan saya, mari kita berpura-pura bahwa saya menguji kepadatan interaksi * anorganikN dan itu tidak signifikan sehingga saya menghapusnya dari analisis dan menjalankan efek utama berikut:
> lm2 <- lm(y1 ~ density + inorganicN, data = Ena)
> anova(lm2)
Analysis of Variance Table
Response: y1
Df Sum Sq Mean Sq F value Pr(>F)
density 1 0.48357 0.48357 3.4113 0.08223 .
inorganicN 1 0.12936 0.12936 0.9126 0.35282
Residuals 17 2.40983 0.14175
Sekarang, ada bedanya apakah saya menggunakan Tipe I atau Tipe II SS (saya tahu beberapa orang keberatan dengan istilah Tipe I & II dll. Tetapi mengingat SAS yang populer itu mudah saja). R anova {stats} menggunakan Tipe I secara default. Saya dapat menghitung tipe II SS, F, dan P untuk kepadatan dengan membalik urutan efek utama saya atau saya dapat menggunakan paket "mobil" Dr. John Fox (pendamping regresi terapan). Saya lebih suka metode yang terakhir karena lebih mudah untuk masalah yang lebih kompleks.
library(car)
Anova(lm2)
Sum Sq Df F value Pr(>F)
density 0.58425 1 4.1216 0.05829 .
inorganicN 0.12936 1 0.9126 0.35282
Residuals 2.40983 17
Pemahaman saya adalah bahwa hipotesis tipe II adalah, "Tidak ada efek linear dari x1 pada y1 diberikan efek (memegang konstan?) X2" dan sama untuk x2 diberikan x1. Saya kira di sinilah saya bingung. Apa hipotesis yang diuji oleh ANOVA menggunakan metode tipe I (berurutan) di atas dibandingkan dengan hipotesis menggunakan metode tipe II?
Pada kenyataannya, data saya sedikit lebih kompleks karena saya mengukur banyak metrik pertumbuhan tanaman serta dinamika nutrisi dan dekomposisi serasah. Analisis saya yang sebenarnya adalah sesuatu seperti:
Y <- cbind(y1 + y2 + y3 + y4 + y5)
# Type II
mlm1 <- lm(Y ~ density + nitrate + Npred, data = Ena)
Manova(mlm1)
Type II MANOVA Tests: Pillai test statistic
Df test stat approx F num Df den Df Pr(>F)
density 1 0.34397 1 5 12 0.34269
nitrate 1 0.99994 40337 5 12 < 2e-16 ***
Npred 1 0.65582 5 5 12 0.01445 *
# Type I
maov1 <- manova(Y ~ density + nitrate + Npred, data = Ena)
summary(maov1)
Df Pillai approx F num Df den Df Pr(>F)
density 1 0.99950 4762 5 12 < 2e-16 ***
nitrate 1 0.99995 46248 5 12 < 2e-16 ***
Npred 1 0.65582 5 5 12 0.01445 *
Residuals 16
sumber