Bagaimana cara membenarkan istilah kesalahan dalam ANOVA faktorial?

13

Sebuah pertanyaan yang mungkin sangat mendasar tentang ANOVA multi-faktorial. Asumsikan desain dua arah di mana kami menguji kedua efek utama A, B, dan interaksi A: B. Ketika menguji efek utama untuk A dengan tipe I SS, efek SS dihitung sebagai perbedaan , di mana adalah jumlah kesalahan residual kuadrat untuk model dengan hanya memotong, dan RSS untuk model dengan faktor A ditambahkan. Pertanyaan saya menyangkut pilihan untuk istilah kesalahan:RSS(1)-RSS(SEBUAH)RSS(1)RSS(SEBUAH)

Bagaimana Anda membenarkan bahwa istilah kesalahan untuk tes ini biasanya dihitung dari RSS model penuh A + B + A: B yang mencakup efek utama dan interaksi?

FSEBUAH=(RSS1-RSSSEBUAH)/(dfRSS1-dfRSSSEBUAH)RSSSEBUAH+B+SEBUAH:B/dfRSSSEBUAH+B+SEBUAH:B

... sebagai kebalikan dari mengambil istilah kesalahan dari model tidak dibatasi dari perbandingan aktual (RSS hanya dari efek utama A dalam kasus di atas):

FSEBUAH=(RSS1-RSSSEBUAH)/(dfRSS1-dfRSSSEBUAH)RSSSEBUAH/dfRSSSEBUAH

Ini membuat perbedaan, karena istilah kesalahan dari model penuh mungkin sering (tidak selalu) lebih kecil dari istilah kesalahan dari model tidak dibatasi dalam perbandingan. Tampaknya pilihan untuk istilah kesalahan agak sewenang-wenang, menciptakan ruang untuk perubahan nilai p yang diinginkan hanya dengan menambahkan / menghilangkan faktor-faktor yang tidak benar-benar menarik, tetapi tetap mengubah istilah kesalahan.

Dalam contoh berikut, nilai-F untuk A berubah sangat tergantung pada pilihan untuk model lengkap, meskipun perbandingan aktual untuk efek SS tetap sama.

> DV  <- c(41,43,50, 51,43,53,54,46, 45,55,56,60,58,62,62,
+          56,47,45,46,49, 58,54,49,61,52,62, 59,55,68,63,
+          43,56,48,46,47, 59,46,58,54, 55,69,63,56,62,67)

> IV1 <- factor(rep(1:3, c(3+5+7, 5+6+4, 5+4+6)))
> IV2 <- factor(rep(rep(1:3, 3), c(3,5,7, 5,6,4, 5,4,6)))
> anova(lm(DV ~ IV1))                           # full model = unrestricted model (just A)
          Df  Sum Sq Mean Sq F value Pr(>F)
IV1        2  101.11  50.556  0.9342 0.4009
Residuals 42 2272.80  54.114

> anova(lm(DV ~ IV1 + IV2))                     # full model = A+B
          Df  Sum Sq Mean Sq F value   Pr(>F)    
IV1        2  101.11   50.56  1.9833   0.1509    
IV2        2 1253.19  626.59 24.5817 1.09e-07 ***
Residuals 40 1019.61   25.49                     

> anova(lm(DV ~ IV1 + IV2 + IV1:IV2))           # full model = A+B+A:B
          Df  Sum Sq Mean Sq F value    Pr(>F)    
IV1        2  101.11   50.56  1.8102    0.1782    
IV2        2 1253.19  626.59 22.4357 4.711e-07 ***
IV1:IV2    4   14.19    3.55  0.1270    0.9717    
Residuals 36 1005.42   27.93

Pertanyaan yang sama berlaku untuk tipe II SS, dan secara umum untuk hipotesis linear umum, yaitu, untuk perbandingan model antara model terbatas dan tidak dibatasi dalam model penuh. (Untuk tipe III SS, model tidak terbatas selalu merupakan model lengkap, jadi pertanyaannya tidak muncul di sana)

caracal
sumber
Saya mungkin hanya bingung dengan pertanyaan Anda, tetapi untuk menguji efek dengan Tipe 1 SS, penyebutnya adalah yang Anda miliki dalam ekspresi kedua Anda. Nilai-F dalam output dari menjalankan dihitung melalui ekspresi kedua Anda. Yaitu, jika Anda berlari dan menyambungkan nilai yang sesuai ke ekspresi kedua Anda, Anda mendapatkan . Beri tahu saya jika saya benar-benar kehilangan kekhawatiran Anda. F = 0,9342SEBUAHanova(lm(DV ~ IV1))anova(lm(DV ~ 1))anova(lm(DV ~ IV1))F=0,9342
@ MikeWierzbicki Anda benar bahwa jika model lengkap hanya berisi IV1(contoh 1), maka dua ekspresi untuk penyebut identik. Namun, ketika model lengkap mengandung efek tambahan, penyebut untuk pengujian berubah meskipun perbandingan model ( vs untuk tipe 1 SS) tidak. Dalam 3 contoh, rata-rata kuadrat untuk tidak berubah (perbandingan model yang sama dalam semua kasus), tetapi kesalahan kuadrat rata-rata tidak. Saya tertarik pada apa yang membenarkan perubahan istilah kesalahan saat perbandingan sebenarnya tetap sama. ASEBUAH~ 1~ IV1 + 1SEBUAH
caracal
Hai @caracal, senang melihat jawaban yang begitu lama tiba-tiba diterima! :-) Bersulang.
Amuba mengatakan Reinstate Monica

Jawaban:

4

Ini adalah pertanyaan yang sangat lama, dan saya percaya bahwa jawaban @ung sangat bagus (+1). Tetapi karena itu tidak sepenuhnya meyakinkan untuk @caracal, dan karena saya juga tidak sepenuhnya mengikuti semua seluk beluknya, saya ingin memberikan gambaran sederhana yang menggambarkan bagaimana saya memahami masalah ini.


Pertimbangkan ANOVA dua arah (faktor A memiliki tiga tingkat, faktor B memiliki dua tingkat) dengan kedua faktor tersebut jelas sangat signifikan:

ANOVA faktorial jumlah kuadrat

SS untuk faktor A sangat besar. SS untuk faktor B jauh lebih kecil, tetapi dari gambar di atas jelas bahwa faktor B juga sangat signifikan.

Kesalahan SS untuk model yang mengandung kedua faktor diwakili oleh salah satu dari enam Gaussians, dan ketika membandingkan SS untuk faktor B dengan kesalahan SS ini, tes akan menyimpulkan bahwa faktor B adalah signifikan.

Kesalahan SS untuk model yang hanya mengandung faktor B, sangat besar! Membandingkan SS untuk faktor B dengan kesalahan masif SS ini pasti akan menghasilkan B tampak tidak signifikan. Yang jelas bukan itu masalahnya.

Itulah mengapa masuk akal untuk menggunakan SS kesalahan dari model lengkap.

amuba kata Reinstate Monica
sumber
2

Pembaruan: Untuk memperjelas beberapa poin yang saya sampaikan di sini, saya telah menambahkan beberapa tautan ke tempat-tempat di mana saya mendiskusikan ide-ide yang relevan secara lebih lengkap.


Tes F memeriksa apakah ada lebih banyak variabilitas (khususnya kuadrat rata-rata) yang dikaitkan dengan faktor daripada yang diharapkan secara kebetulan. Berapa banyak variasi yang kita harapkan secara kebetulan diperkirakan dari jumlah kesalahan kuadrat, yaitu, seberapa banyak variabilitas disebabkan (terkait dengan) tidak ada faktor yang diketahui. Ini adalah residu Anda, apa yang tersisa setelah memperhitungkan semua yang Anda ketahui. Dalam contoh Anda, berisi lebih dari sekadar kesalahan residual, ia juga mengandung variabilitas karena faktor-faktor yang diketahui. Sementara berteori untuk memantul ke beberapa derajat secara kebetulan, jumlah itu tidak berteori untuk didorong oleh faktor-faktor lain yang diketahui 1 . Dengan demikian, tidak pantas menggunakan S S A M S A M S A + B + A BRSSSEBUAHSSSEBUAHM.SSEBUAHsebagai penyebut dalam uji F Anda. Selain itu, menggunakan memberi Anda lebih banyak kekuatan, mengurangi kemungkinan kesalahan tipe II dan tidak seharusnya mengembang kesalahan tipe I. M.SSEBUAH+B+SEBUAHB

Ada beberapa masalah lebih lanjut dalam pertanyaan Anda. Anda menyebutkan bahwa tidak selalu yang terendah, dan dalam contoh Anda, . Ini karena interaksi sebenarnya tidak terkait dengan variabilitasnya sendiri. Itu muncul disebabkan oleh tidak lebih dari kesempatan. Ada formula yang tepat, tetapi agak rumit, yang menentukan bagaimana daya akan berubah jika faktor-faktor yang berbeda dimasukkan atau dikeluarkan dari model. Saya tidak memilikinya di ujung jari saya, tetapi intinya sederhana: Ketika Anda memasukkan faktor lain, RSS berkurang (memberi Anda lebih banyak kekuatan), tetapiRSSfkamullM.SSEBUAH+B+SEBUAHB>M.SSEBUAH+BSSSEBUAHB=14.19dfRturun juga (menghasilkan lebih sedikit daya). Saldo tradeoff ini pada dasarnya ditentukan oleh apakah SS yang terkait dengan faktor itu nyata, atau hanya karena kebetulan, yang dalam praktiknya, secara longgar ditunjukkan oleh apakah faktor tersebut signifikan 2 . Namun, menghilangkan faktor dari model yang tidak signifikan sehingga untuk mendapatkan istilah kesalahan yang tepat secara logis setara dengan prosedur pencarian model otomatis, bahkan jika Anda tidak memiliki perangkat lunak Anda melakukannya secara otomatis untuk Anda. Anda harus tahu bahwa ada banyak masalah dengan melakukan ini. Masalah-masalah itu, dan prosedur alternatif dibahas di tempat lain di CV 3 .

Topik terakhir menyangkut berbagai jenis SS. Pertama, penggunaan berbagai jenis SS tidak membuat Anda keluar dari memerlukan pembenaran logis dari analisis Anda. Namun, tipe I - III SS terkait dengan masalah yang berbeda. Dalam contoh Anda, saya mengumpulkan faktor-faktor Anda ortogonal, yaitu Anda menjalankan percobaan di mana Anda menetapkan sama n untuk setiap kombinasi tingkat faktor. Namun, jika Anda melakukan penelitian observasional, atau jika Anda memiliki masalah putus sekolah, faktor-faktor Anda akan dikorelasikan. Implikasinya adalah bahwa tidak ada cara unik untuk mempartisi SS dan oleh karena itu tidak ada jawaban unik untuk analisis Anda. Dengan kata lain, berbagai jenis SS harus dilakukan dengan pembilang yang mungkin berbeda untuk uji F Anda ketika faktor Anda berkorelasi 4 .

1. Perhatikan bahwa dengan model multi-level, suatu faktor dapat berteori untuk memasukkan variabilitas dari faktor-faktor lain, tergantung pada bagaimana model tersebut ditentukan. Saya sedang mendiskusikan ANOVA biasa di sini, yang sepertinya Anda tanyakan.
2. Lihat: Bagaimana menambahkan IV kedua membuat IV pertama signifikan?
3. Lihat: Algoritma untuk pemilihan model otomatis .
4. Lihat: Bagaimana menafsirkan ANOVA dan MANOVA tipe I (berurutan)?

gung - Pasang kembali Monica
sumber
1
Terima kasih atas jawaban anda! Saya tidak 100% yakin: Anda mengatakan bahwa "RSS (A) mengandung lebih dari sekedar kesalahan residual, itu juga mengandung variabilitas karena faktor-faktor yang diketahui." Tetapi ini tergantung pada apa model yang benar. Mungkin dan tidak berpengaruh - kita tidak tahu ini, itu hanya hipotesis yang sedang kita uji. Dan selain pengaruh yang dihipotesiskan, mungkin ada yang tidak diketahui. Jadi bagaimana kita membenarkan a-priori model mana yang lebih dekat dengan kebenaran? Dalam regresi, situasinya setara. Apakah Anda memiliki beberapa sumber literatur yang dapat saya konsultasikan? BSEBUAH:B
caracal
1
+1 dan saya baru saja mengirim jawaban yang berusaha memberikan ilustrasi untuk paragraf besar pertama Anda.
Amuba kata Reinstate Monica
0

Pembenarannya adalah bahwa faktor A menjelaskan persentase yang lebih besar dari variasi yang tidak dapat dijelaskan dalam model A + B dibandingkan dengan model A, karena faktor B menjelaskan bagian yang signifikan (dan dengan demikian 'menghilangkannya' dari analisis).

CDX
sumber