Model statistik linier yang diterapkan oleh Kutner et al. menyatakan berikut tentang keberangkatan dari asumsi normalitas model ANOVA: Kurtosis distribusi kesalahan (lebih atau kurang memuncak dari distribusi normal) lebih penting daripada kemiringan distribusi dalam hal efek pada kesimpulan .
Saya agak bingung dengan pernyataan ini dan tidak berhasil menemukan informasi terkait, baik di buku atau online. Saya bingung karena saya juga mengetahui bahwa plot QQ dengan ekor yang berat merupakan indikasi bahwa asumsi normalitas "cukup baik" untuk model regresi linier, sedangkan plot QQ yang miring lebih menjadi perhatian (mis. Transformasi mungkin tepat) .
Apakah saya benar bahwa alasan yang sama berlaku untuk ANOVA dan bahwa pilihan kata-kata mereka ( lebih penting dalam hal efek pada kesimpulan ) baru saja dipilih dengan buruk? Yaitu distribusi miring memiliki konsekuensi yang lebih parah dan harus dihindari, sedangkan kurtosis dalam jumlah kecil dapat diterima.
EDIT: Seperti yang dikemukakan oleh rolando2, sulit untuk menyatakan bahwa yang satu lebih penting daripada yang lain dalam semua kasus, tapi saya hanya mencari beberapa wawasan umum. Masalah utama saya adalah bahwa saya diajari bahwa dalam regresi linier sederhana, plot QQ dengan ekor yang lebih berat (= kurtosis?) OK, karena uji F cukup kuat terhadap hal ini. Di sisi lain, plot QQ miring (berbentuk parabola) biasanya menjadi perhatian yang lebih besar. Ini tampaknya bertentangan langsung dengan pedoman yang disediakan oleh buku teks saya untuk ANOVA, meskipun model ANOVA dapat dikonversi menjadi model regresi dan harus memiliki asumsi yang sama.
Saya yakin saya mengabaikan sesuatu atau saya memiliki asumsi yang salah, tetapi saya tidak tahu apa itu.
Jawaban:
Kesulitannya adalah bahwa skewness dan kurtosis tergantung; efeknya tidak dapat sepenuhnya dipisahkan.
Masalahnya adalah bahwa jika Anda ingin memeriksa efek dari distribusi yang sangat miring, Anda juga harus memiliki distribusi dengan kurtosis tinggi.
* (kurtosis momen keempat berskala biasa, bukan kurtosis berlebih)
Khan dan Rayner (yang disebutkan dalam jawaban sebelumnya) bekerja dengan keluarga yang memungkinkan beberapa eksplorasi dampak skewness dan kurtosis, tetapi mereka tidak dapat menghindari masalah ini, sehingga upaya mereka untuk memisahkan mereka sangat membatasi sejauh mana efek dari kemiringan dapat dieksplorasi.
Misalnya, jika Anda ingin melihat efek kemiringan tinggi - katakanlah kemiringan> 5, Anda tidak bisa mendapatkan distribusi dengan kurtosis kurang dari 26!
Jadi, jika Anda ingin menyelidiki dampak kemiringan tinggi, Anda tidak dapat menghindari menyelidiki dampak kurtosis tinggi. Akibatnya jika Anda mencoba untuk memisahkan mereka, Anda pada dasarnya menahan diri Anda tidak dapat menilai efek peningkatan kecenderungan ke tingkat yang tinggi.
Yang mengatakan, setidaknya untuk keluarga distribusi yang mereka pertimbangkan, dan dalam batas-batas yang dimiliki hubungan antara mereka, penyelidikan oleh Khan dan Rayner tampaknya menunjukkan bahwa kurtosis adalah masalah utama.
sumber
Masalah ini dibahas dalam "Keteguhan terhadap Non-Normalitas Tes Umum untuk Masalah Banyak Contoh Lokasi" oleh Khan dan Rayner.
Mereka menemukan tes ANOVA jauh lebih dipengaruhi oleh kurtosis daripada skewness, dan efek skewness tidak terkait dengan arahnya.
Jika penyimpangan dari normalitas dicurigai, tes Kruskal-Wallis mungkin merupakan pilihan yang lebih baik. Tes Kruskal-Wallis lebih kuat untuk penyimpangan dari normalitas karena memeriksa hipotesis bahwa median pengobatan identik. ANOVA meneliti hipotesis bahwa cara perawatan identik.
sumber