Misalkan saya melakukan percobaan dengan dua faktor atau lebih. Keseluruhan ANOVA dibangun, dan kemudian kami menindaklanjuti dengan dua set atau lebih tes post hoc , katakanlah beberapa perbandingan. Pertanyaan saya adalah tentang seberapa besar --- dan berapa banyak --- keluarga harus digunakan sebagai dasar untuk penyesuaian multiplisitas dari tes post hoc ini .
Contohnya adalah dataset warp-breaks dari buku Tukey tentang EDA. Ada dua faktor: wool
(pada dua level) dan tension
(pada tiga level). Tabel ANOVA adalah:
Source Df Sum Sq Mean Sq F value Pr(>F)
wool 1 450.7 450.67 3.7653 0.0582130
tension 2 2034.3 1017.13 8.4980 0.0006926
wool:tension 2 1002.8 501.39 4.1891 0.0210442
Residuals 48 5745.1 119.69
Jelas, interaksi diperlukan dalam model. Jadi kami memutuskan untuk melakukan perbandingan tingkat masing-masing faktor, mempertahankan faktor lainnya tetap. Hasilnya di bawah ini, dengan beberapa penjelasan yang akan dirujuk kemudian:
*** Pairwise comparisons of tension for each wool ***
*** All combined: Family T ***
wool = A: *** Family T|A ***
contrast estimate SE df t.ratio
L - M 20.5555556 5.157299 48 3.986
L - H 20.0000000 5.157299 48 3.878
M - H -0.5555556 5.157299 48 -0.108
wool = B: *** Family T|B ***
contrast estimate SE df t.ratio
L - M -0.5555556 5.157299 48 -0.108
L - H 9.4444444 5.157299 48 1.831
M - H 10.0000000 5.157299 48 1.939
*** Comparison of wool for each tension ***
*** All combined: Family W ***
tension = L: *** Family W|L ***
contrast estimate SE df t.ratio
A - B 16.333333 5.157299 48 3.167
tension = M: *** Family W|M ***
contrast estimate SE df t.ratio
A - B -4.777778 5.157299 48 -0.926
tension = H: *** Family W|H ***
contrast estimate SE df t.ratio
A - B 5.777778 5.157299 48 1.120
Saya pikir ada praktik yang berbeda di luar sana, dan saya ingin tahu mana yang paling umum, dan argumen apa yang akan dibuat orang untuk atau menentang setiap pendekatan. Dalam menghitung nilai disesuaikan , sebaiknya kita melakukan penyesuaian ...
- masing-masing dari lima keluarga terkecil (T | A, T | B, ..., W | H) secara terpisah? (Catatan - 3 keluarga terakhir hanya memiliki satu tes sehingga tidak akan ada penyesuaian multiplisitas untuk mereka)
- masing-masing keluarga besar (T, dengan 6 tes dan W, dengan 3 tes) secara terpisah?
- semua tes dianggap sebagai satu keluarga besar?
Saya tertarik pada apa yang biasanya dilakukan orang (bahkan jika mereka belum banyak memikirkannya) dan mengapa (jika mereka punya). Beberapa hal yang mungkin saya sebutkan adalah:
- Ada 3 tes dalam tabel ANOVA. Saya tidak ingat melihat ada yang mempertimbangkan penyesuaian multiplisitas pada tes ANOVA. Jika itu masalahnya, dan Anda merekomendasikan opsi (3), apakah Anda tidak konsisten?
- Jika kami telah melakukan percobaan yang agak lebih kecil di mana semua tes kurang kuat, mungkin saja interaksi tidak akan signifikan, yang mengarah ke jumlah yang jauh lebih kecil dari perbandingan post-hoc dari sarana marginal saja. Selain itu, rata-rata marginal bisa memiliki SE lebih kecil dari rata-rata sel dalam percobaan yang lebih besar. Selain itu, jika penyesuaian multiplisitas kurang konservatif, kami dapat memiliki hasil yang lebih "signifikan" dengan data yang lebih sedikit daripada yang kami miliki dengan lebih banyak data.
Tertarik melihat apa yang dikatakan orang ...
sumber
lsmeans
? Itu banyak pekerjaan untuk pertanyaan itu!