Berangkat dari asumsi normalitas dalam ANOVA: apakah kurtosis atau skewness lebih penting?

12

Model statistik linier yang diterapkan oleh Kutner et al. menyatakan berikut tentang keberangkatan dari asumsi normalitas model ANOVA: Kurtosis distribusi kesalahan (lebih atau kurang memuncak dari distribusi normal) lebih penting daripada kemiringan distribusi dalam hal efek pada kesimpulan .

Saya agak bingung dengan pernyataan ini dan tidak berhasil menemukan informasi terkait, baik di buku atau online. Saya bingung karena saya juga mengetahui bahwa plot QQ dengan ekor yang berat merupakan indikasi bahwa asumsi normalitas "cukup baik" untuk model regresi linier, sedangkan plot QQ yang miring lebih menjadi perhatian (mis. Transformasi mungkin tepat) .

Apakah saya benar bahwa alasan yang sama berlaku untuk ANOVA dan bahwa pilihan kata-kata mereka ( lebih penting dalam hal efek pada kesimpulan ) baru saja dipilih dengan buruk? Yaitu distribusi miring memiliki konsekuensi yang lebih parah dan harus dihindari, sedangkan kurtosis dalam jumlah kecil dapat diterima.

EDIT: Seperti yang dikemukakan oleh rolando2, sulit untuk menyatakan bahwa yang satu lebih penting daripada yang lain dalam semua kasus, tapi saya hanya mencari beberapa wawasan umum. Masalah utama saya adalah bahwa saya diajari bahwa dalam regresi linier sederhana, plot QQ dengan ekor yang lebih berat (= kurtosis?) OK, karena uji F cukup kuat terhadap hal ini. Di sisi lain, plot QQ miring (berbentuk parabola) biasanya menjadi perhatian yang lebih besar. Ini tampaknya bertentangan langsung dengan pedoman yang disediakan oleh buku teks saya untuk ANOVA, meskipun model ANOVA dapat dikonversi menjadi model regresi dan harus memiliki asumsi yang sama.

Saya yakin saya mengabaikan sesuatu atau saya memiliki asumsi yang salah, tetapi saya tidak tahu apa itu.

Zenit
sumber
3
Dalam ulasannya tentang kurtosis, DeCarlo (1997) mengemukakan sebaliknya, bahwa kemiringan lebih penting dalam ANOVA dan tes lain tentang persamaan cara. Anda mungkin menemukan kutipan di halaman 297 berguna: columbia.edu/ ~ld208
Anthony
1
Saya akan menemukan pertanyaan yang paling produktif jika dapat diselesaikan menjadi sebuah pernyataan seperti "Skewness jauh lebih penting untuk kesimpulan daripada kurtosis bahwa kemiringan pada tingkat ___ biasanya akan mendistorsi hasil sebanyak kurtosis pada level ___ . " Tanpa kuantifikasi semacam itu, sekadar mengatakan yang satu atau yang lain lebih penting tidak banyak membantu kita.
rolando2
Simulasi ini emis.de/journals/HOA/ADS/Volume7_4/206.pdf oleh Khan dan Rayner (2003) dalam JURNAL MATEMATIKA YANG DITERAPKAN DAN ILMU KEPUTUSAN menyatakan bahwa "Baik tes ANOVA dan Kruskal-Wallis jauh lebih dipengaruhi oleh kurtosis dari distribusi kesalahan daripada oleh kemiringannya "(hal. 204).
bsbk
Sebuah pertanyaan yang sangat erat terkait dengan uji-t dua sampel - secara efektif ANOVA satu arah dengan dua tingkat dalam faktor - adalah stats.stackexchange.com/questions/38967/… ... Saat ini ada karunia di sana untuk ditambahkan referensi karena tidak ada jawaban yang ada yang berisi kutipan, jadi penjawab pertanyaan ini mungkin ingin melihatnya.
Silverfish
Saya setuju dengan @ rolando2: "skewness lebih buruk daripada kurtosis" atau sebaliknya adalah pernyataan yang agak kosong tanpa menyebutkan tingkat skewness / kurtosis. Tetapi juga lebih banyak yang perlu dipertimbangkan! Misalnya, ketahanan terhadap pelanggaran-pelanggaran normalitas ini sebagian tergantung pada apakah ukuran kelompoknya sama , dan kekokohan terhadap kemiringan dapat bergantung pada arah kemiringan - lebih buruk jika satu kelompok adalah satu arah yang miring, dan kelompok yang lain condong pada sebaliknya, dibandingkan jika kedua kelompok condong ke arah yang sama. (Ini dari ingatan dan uji ulang tetapi itu adalah jenis ANOVA.)
Silverfish

Jawaban:

6

Kesulitannya adalah bahwa skewness dan kurtosis tergantung; efeknya tidak dapat sepenuhnya dipisahkan.

Masalahnya adalah bahwa jika Anda ingin memeriksa efek dari distribusi yang sangat miring, Anda juga harus memiliki distribusi dengan kurtosis tinggi.

2+1

* (kurtosis momen keempat berskala biasa, bukan kurtosis berlebih)

Khan dan Rayner (yang disebutkan dalam jawaban sebelumnya) bekerja dengan keluarga yang memungkinkan beberapa eksplorasi dampak skewness dan kurtosis, tetapi mereka tidak dapat menghindari masalah ini, sehingga upaya mereka untuk memisahkan mereka sangat membatasi sejauh mana efek dari kemiringan dapat dieksplorasi.

β2β21

Misalnya, jika Anda ingin melihat efek kemiringan tinggi - katakanlah kemiringan> 5, Anda tidak bisa mendapatkan distribusi dengan kurtosis kurang dari 26!

Jadi, jika Anda ingin menyelidiki dampak kemiringan tinggi, Anda tidak dapat menghindari menyelidiki dampak kurtosis tinggi. Akibatnya jika Anda mencoba untuk memisahkan mereka, Anda pada dasarnya menahan diri Anda tidak dapat menilai efek peningkatan kecenderungan ke tingkat yang tinggi.

Yang mengatakan, setidaknya untuk keluarga distribusi yang mereka pertimbangkan, dan dalam batas-batas yang dimiliki hubungan antara mereka, penyelidikan oleh Khan dan Rayner tampaknya menunjukkan bahwa kurtosis adalah masalah utama.

>2

Glen_b -Reinstate Monica
sumber
11

Masalah ini dibahas dalam "Keteguhan terhadap Non-Normalitas Tes Umum untuk Masalah Banyak Contoh Lokasi" oleh Khan dan Rayner.

Mereka menemukan tes ANOVA jauh lebih dipengaruhi oleh kurtosis daripada skewness, dan efek skewness tidak terkait dengan arahnya.

Jika penyimpangan dari normalitas dicurigai, tes Kruskal-Wallis mungkin merupakan pilihan yang lebih baik. Tes Kruskal-Wallis lebih kuat untuk penyimpangan dari normalitas karena memeriksa hipotesis bahwa median pengobatan identik. ANOVA meneliti hipotesis bahwa cara perawatan identik.

Brian Spiering
sumber
Apakah ini kemudian juga menunjukkan saya harus menafsirkan plot QQ berbeda untuk regresi linier dan ANOVA? Mayoritas transformasi yang saya lakukan mengurangi kemiringan, tetapi meninggalkan ekor yang sedikit berat (= kurtosis?). Saya mendapat kesan bahwa F-test cukup kuat untuk menangani yang terakhir tetapi tidak yang pertama. Atau "ekor berat ini baik-baik saja" merupakan kesalahpahaman di pihak saya? Saya tidak dapat membayangkan bahwa ada perbedaan mendasar antara keduanya, karena model ANOVA juga dapat ditulis ulang sebagai model regresi linier.
Zenit