Beberapa bulan yang lalu saya memposting pertanyaan tentang tes homoscedasticity di R pada SO, dan Ian Fellows menjawab bahwa (saya akan memparafrasekan jawabannya dengan sangat longgar):
Tes homoscedasticity bukan alat yang baik ketika menguji kebaikan model Anda. Dengan sampel kecil, Anda tidak memiliki kekuatan yang cukup untuk mendeteksi keberangkatan dari homoseksualitas, sementara dengan sampel besar Anda memiliki "banyak kekuatan", sehingga Anda lebih mungkin untuk menyaring bahkan keberangkatan sepele dari kesetaraan.
Jawabannya yang luar biasa datang sebagai tamparan di wajah saya. Saya biasa memeriksa asumsi normalitas dan homoseksualitas setiap kali saya menjalankan ANOVA.
Apa, menurut Anda, praktik terbaik saat memeriksa asumsi ANOVA?
Beberapa grafik biasanya akan jauh lebih mencerahkan daripada nilai p dari uji normalitas atau homoskedastisitas. Plot mengamati variabel dependen terhadap variabel independen. Plot pengamatan terhadap kecocokan. Plot residual terhadap variabel independen. Selidiki apa pun yang terlihat aneh di plot ini. Jika sesuatu tidak terlihat aneh, saya tidak akan khawatir tentang uji asumsi yang signifikan.
sumber
Berikut adalah beberapa panduan web yang sangat bagus untuk memeriksa asumsi ANOVA & apa yang harus dilakukan jika gagal. Ini satu. Ini yang lain.
Pada dasarnya mata Anda adalah juri terbaik, jadi lakukan beberapa analisis data eksplorasi . Itu berarti memplot data - histogram dan plot kotak adalah cara yang baik untuk menilai normalitas dan homoseksualitas. Dan ingat ANOVA kuat untuk pelanggaran kecil ini.
sumber
Plot QQ adalah cara yang cukup baik untuk mendeteksi non-normalitas.
Untuk homoseksualitas, cobalah tes Levene atau tes Brown-Forsythe. Keduanya serupa, meskipun BF sedikit lebih kuat. Mereka kurang sensitif terhadap non-normalitas daripada tes Bartlett, tetapi bahkan, saya telah menemukan mereka tidak menjadi yang paling dapat diandalkan dengan ukuran sampel kecil.
Plot QQ
Brown-Forsythe test
Tes Levene
sumber
Saya setuju dengan orang lain bahwa pengujian signifikansi untuk asumsi bermasalah.
Saya suka menangani masalah ini dengan membuat plot tunggal yang memaparkan semua asumsi model yang diperlukan untuk memiliki kesalahan tipe I yang akurat dan kesalahan tipe II yang rendah (daya tinggi). Untuk kasus ANOVA dengan 2 kelompok (dua sampel t-test) plot ini adalah kebalikan normal dari fungsi distribusi kumulatif empiris (ECDF) yang dikelompokkan berdasarkan kelompok (lihat komentar plot QQ pada posting sebelumnya). Agar uji-t bekerja dengan baik, kedua kurva harus garis lurus paralel. Untukk - Contoh masalah ANOVA secara umum yang Anda miliki k garis lurus sejajar.
Metode semi-parametrik (peringkat) seperti tes Wilcoxon dan Kruskal-Wallis membuat asumsi jauh lebih sedikit. Logit ECDF harus paralel agar tes Wilcoxon-Kruskal-Wallis memiliki daya maksimum (kesalahan tipe I tidak pernah menjadi masalah bagi mereka). Linearitas tidak diperlukan. Tes peringkat membuat asumsi tentang bagaimana distribusi kelompok yang berbeda terkait dengan yang lain, tetapi jangan membuat asumsi tentang bentuk distribusi satu.
sumber