Hasil yang bertentangan dari tipe III jumlah kuadrat di ANOVA di SAS dan R

15

Saya menganalisis data dari percobaan faktorial yang tidak seimbang baik dengan SASdan R. Keduanya SASdan Rmemberikan jumlah kuadrat Tipe I yang serupa tetapi jumlah kuadrat Tipe III mereka berbeda satu sama lain. Berikut adalah SASdan Rkode dan output.

DATA ASD;
INPUT Y T B;
DATALINES;
 20 1 1
 25 1 2
 26 1 2
 22 1 3
 25 1 3
 25 1 3
 26 2 1
 27 2 1
 22 2 2
 31 2 3
;

PROC GLM DATA=ASD;
CLASS T B;
MODEL Y=T|B;
RUN;

Tipe I SS dari SAS

Source  DF       Type I SS     Mean Square    F Value    Pr > F
T       1     17.06666667     17.06666667       9.75    0.0354
B       2     12.98000000      6.49000000       3.71    0.1227
T*B     2     47.85333333     23.92666667      13.67    0.0163

Tipe III SS dari SAS

Source  DF     Type III SS     Mean Square    F Value    Pr > F
T       1     23.07692308     23.07692308      13.19    0.0221
B       2     31.05333333     15.52666667       8.87    0.0338
T*B     2     47.85333333     23.92666667      13.67    0.0163

Kode R

Y <- c(20, 25, 26, 22, 25, 25, 26, 27, 22, 31)
T <- factor(x=rep(c(1, 2), times=c(6, 4)))
B <- factor(x=rep(c(1, 2, 3, 1, 2, 3), times=c(1, 2, 3, 2, 1, 1)))
Data <- data.frame(Y, T, B)
Data.lm <- lm(Y~T*B, data = Data)
anova(Data.lm)
drop1(Data.lm,~.,test="F") 

Tipe I SS dari R

Analysis of Variance Table

Response: Y
          Df Sum Sq Mean Sq F value  Pr(>F)  
T          1 17.067  17.067  9.7524 0.03543 *
B          2 12.980   6.490  3.7086 0.12275  
T:B        2 47.853  23.927 13.6724 0.01629 *
Residuals  4  7.000   1.750                  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 

Tipe III SS dari R

Single term deletions

Model:
Y ~ T * B
       Df Sum of Sq    RSS     AIC F value  Pr(>F)  
<none>               7.000  8.4333                  
T       1    28.167 35.167 22.5751 16.0952 0.01597 *
B       2    20.333 27.333 18.0552  5.8095 0.06559 .
T:B     2    47.853 54.853 25.0208 13.6724 0.01629 *
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 

Apakah saya melewatkan sesuatu di sini? Jika tidak, yang mana yang benar Tipe III SS?

MYaseen208
sumber
Lihat respons John Fox di sini: tolstoy.newcastle.edu.au/R/help/05/11/16368.html
Aaron

Jawaban:

29

Tipe III SS tergantung pada parameterisasi yang digunakan. Jika saya atur

  options(contrasts=c("contr.sum","contr.poly"))

sebelum menjalankan lm()dan kemudian drop1()saya mendapatkan tipe III SS yang sama persis dengan SAS. Untuk dogma R-komunitas tentang masalah ini, Anda harus membaca 'Venables' Exegeses on linear models .

Lihat juga: Bagaimana cara melakukan ANOVA SS Tipe-III dalam R dengan kode kontras?

Ben Bolker
sumber
1
@ Peter Jika Anda pikir itu bisa masuk dalam komentar, mengapa tidak. Saya rasa tidak, jadi mengapa tidak mengajukan pertanyaan baru (dan tautan ke yang ini)?
chl
1
@ chl Poin dasar saya adalah bahwa efek utama memang memiliki makna di hadapan interaksi - mereka adalah efek ketika variabel lainnya adalah 0. Sering kali ini bermakna. Tidak yakin ini layak untuk keseluruhan utas.
Peter Flom - Reinstate Monica
3
Saya setuju bahwa ada situasi di mana efek utama dapat ditafsirkan - Venables mengambil garis yang sangat kuat - tetapi ada banyak situasi di mana mereka sulit. Saya pikir "jangan lakukan ini kecuali Anda tahu apa yang Anda lakukan" adalah pengaturan default yang masuk akal ...
Ben Bolker
1
Apakah yang berikut akan mengatur ulang kontras ke standar R? options(contrasts=c("contr.treatment", "contr.poly"))
Rasmus Larsen
1
Iya ...........
Ben Bolker