Memeriksa asumsi ANOVA

16

Beberapa bulan yang lalu saya memposting pertanyaan tentang tes homoscedasticity di R pada SO, dan Ian Fellows menjawab bahwa (saya akan memparafrasekan jawabannya dengan sangat longgar):

Tes homoscedasticity bukan alat yang baik ketika menguji kebaikan model Anda. Dengan sampel kecil, Anda tidak memiliki kekuatan yang cukup untuk mendeteksi keberangkatan dari homoseksualitas, sementara dengan sampel besar Anda memiliki "banyak kekuatan", sehingga Anda lebih mungkin untuk menyaring bahkan keberangkatan sepele dari kesetaraan.

Jawabannya yang luar biasa datang sebagai tamparan di wajah saya. Saya biasa memeriksa asumsi normalitas dan homoseksualitas setiap kali saya menjalankan ANOVA.

Apa, menurut Anda, praktik terbaik saat memeriksa asumsi ANOVA?

aL3xa
sumber

Jawaban:

11

Dalam pengaturan yang diterapkan, biasanya lebih penting untuk mengetahui apakah ada pelanggaran asumsi yang bermasalah untuk disimpulkan.

Tes asumsi berdasarkan uji signifikansi jarang menarik dalam sampel besar, karena sebagian besar tes inferensial kuat terhadap pelanggaran asumsi ringan.

Salah satu fitur bagus penilaian grafis dari asumsi adalah bahwa mereka memusatkan perhatian pada tingkat pelanggaran dan bukan signifikansi statistik dari setiap pelanggaran.

Namun, juga dimungkinkan untuk fokus pada ringkasan numerik data Anda yang mengukur tingkat pelanggaran asumsi dan bukan signifikansi statistik (misalnya, nilai skewness, nilai kurtosis, rasio varian grup terbesar hingga terkecil, dll.). Anda juga bisa mendapatkan kesalahan standar atau interval kepercayaan pada nilai-nilai ini, yang akan menjadi lebih kecil dengan sampel yang lebih besar. Perspektif ini konsisten dengan gagasan umum bahwa signifikansi statistik tidak setara dengan kepentingan praktis.

Jeromy Anglim
sumber
1
+1 untuk jawaban hebat yang membungkus semuanya. Cara menerapkan prosedur numerik yang disebutkan dengan baik dan aplikatif dijelaskan dalam Tabachnik dan Fidell's Menggunakan Multivariate Statistics (untuk SPSS dan SAS): amazon.com/Using-Multivariate-Statistics-Barbara-Tabachnick/dp/… (Tetapi lihat Erratas di disertai halaman web)
Henrik
Yah, saya pikir sebagian besar ringkasan waktu seperti skewness dan kurtosis memiliki nilai yang kecil, variasi sampelnya hanya besar. Seseorang dapat mempertimbangkan untuk menggantinya dengan L_skewness dan L-kurtosis.
kjetil b halvorsen
@ kjetilbhalvorsen Saya kira itu tergantung pada jenis ukuran sampel yang biasanya Anda gunakan. Dalam pengalaman saya, plot dan statistik kemiringan sangat membantu dalam memahami distribusi data.
Jeromy Anglim
@Jeromy Anglim: Oke. Maka saya kira Anda biasanya memiliki ukuran sampel yang sangat besar! Apakah Anda mencoba untuk bootstrap koefisien skewness / kurtosis Anda?
kjetil b halvorsen
9

Beberapa grafik biasanya akan jauh lebih mencerahkan daripada nilai p dari uji normalitas atau homoskedastisitas. Plot mengamati variabel dependen terhadap variabel independen. Plot pengamatan terhadap kecocokan. Plot residual terhadap variabel independen. Selidiki apa pun yang terlihat aneh di plot ini. Jika sesuatu tidak terlihat aneh, saya tidak akan khawatir tentang uji asumsi yang signifikan.

S. Kolassa - Reinstate Monica
sumber
Nasihat yang bagus sebagian besar waktu, tetapi bagaimana dengan kasus dataset besar, di mana Anda tidak bisa melihat semua data secara manual?
dsimcha
1
n1n2<ασ2
2
@dsimcha ulang kumpulan data besar: tergantung pada apa yang Anda maksud dengan "besar". Banyak pengamatan? Gunakan grafik yang bagus (boxplot, dotplot yang gelisah, plot bunga matahari). Banyak variabel independen? Ya, Anda ada benarnya di sana ... Tetapi jika Anda memiliki begitu banyak infus sehingga Anda tidak dapat merencanakan DV terhadap masing-masing IV, saya akan mempertanyakan menggunakan ANOVA sama sekali - sepertinya mungkin sulit untuk menafsirkannya dalam kasus. Beberapa pendekatan pembelajaran mesin pintar mungkin lebih baik (Brian D. Ripley: "Mengutip secara provokatif, 'pembelajaran mesin adalah statistik dikurangi pengecekan model dan asumsi'.")
S. Kolassa - Reinstate Monica
Komentar bagus, +1. Meskipun pertanyaan khusus ini tentang ANOVA, saya berpikir pada tingkat yang lebih umum tentang pertanyaan plot vs tes ketika saya menulis respons saya.
dsimcha
4

Berikut adalah beberapa panduan web yang sangat bagus untuk memeriksa asumsi ANOVA & apa yang harus dilakukan jika gagal. Ini satu. Ini yang lain.

Pada dasarnya mata Anda adalah juri terbaik, jadi lakukan beberapa analisis data eksplorasi . Itu berarti memplot data - histogram dan plot kotak adalah cara yang baik untuk menilai normalitas dan homoseksualitas. Dan ingat ANOVA kuat untuk pelanggaran kecil ini.

Thylacoleo
sumber
4

Plot QQ adalah cara yang cukup baik untuk mendeteksi non-normalitas.

Untuk homoseksualitas, cobalah tes Levene atau tes Brown-Forsythe. Keduanya serupa, meskipun BF sedikit lebih kuat. Mereka kurang sensitif terhadap non-normalitas daripada tes Bartlett, tetapi bahkan, saya telah menemukan mereka tidak menjadi yang paling dapat diandalkan dengan ukuran sampel kecil.

Plot QQ

Brown-Forsythe test

Tes Levene

Christopher Aden
sumber
Plot distribusi relatif (atau contoh, membandingkan dengan distribusi normal) bisa menjadi pengganti yang baik, karena interpretasi mereka bisa lebih jelas untuk pemula.
kjetil b halvorsen
3

Saya setuju dengan orang lain bahwa pengujian signifikansi untuk asumsi bermasalah.

Saya suka menangani masalah ini dengan membuat plot tunggal yang memaparkan semua asumsi model yang diperlukan untuk memiliki kesalahan tipe I yang akurat dan kesalahan tipe II yang rendah (daya tinggi). Untuk kasus ANOVA dengan 2 kelompok (dua sampel t-test) plot ini adalah kebalikan normal dari fungsi distribusi kumulatif empiris (ECDF) yang dikelompokkan berdasarkan kelompok (lihat komentar plot QQ pada posting sebelumnya). Agar uji-t bekerja dengan baik, kedua kurva harus garis lurus paralel. Untukk- Contoh masalah ANOVA secara umum yang Anda miliki k garis lurus sejajar.

Metode semi-parametrik (peringkat) seperti tes Wilcoxon dan Kruskal-Wallis membuat asumsi jauh lebih sedikit. Logit ECDF harus paralel agar tes Wilcoxon-Kruskal-Wallis memiliki daya maksimum (kesalahan tipe I tidak pernah menjadi masalah bagi mereka). Linearitas tidak diperlukan. Tes peringkat membuat asumsi tentang bagaimana distribusi kelompok yang berbeda terkait dengan yang lain, tetapi jangan membuat asumsi tentang bentuk distribusi satu.

Frank Harrell
sumber