Bisakah saya mempercayai hasil ANOVA untuk DV yang tidak terdistribusi normal?

22

Saya telah menganalisis percobaan dengan ANOVA tindakan berulang. ANOVA adalah 3x2x2x2x3 dengan 2 faktor antara-subjek dan 3 di dalam (N = 189). Tingkat kesalahan adalah variabel dependen. Distribusi tingkat kesalahan memiliki kemiringan 3,64 dan kurtosis 15,75. Kemiringan dan kurtosis adalah hasil dari 90% dari tingkat kesalahan berarti menjadi 0. Membaca beberapa utas sebelumnya pada tes normalitas di sini membuat saya sedikit bingung. Saya pikir jika Anda memiliki data yang tidak terdistribusi secara normal, sebaiknya Anda mentransformasikannya jika mungkin, tetapi tampaknya banyak orang berpikir menganalisis data yang tidak normal dengan ANOVA atau uji-T dapat diterima. Bisakah saya mempercayai hasil ANOVA?

(FYI, Di masa depan saya bermaksud untuk menganalisis tipe data ini dalam R dengan model campuran dengan distribusi binomial)

Mat
sumber
1
Bisakah Anda menautkan ke beberapa utas itu? Naluri saya adalah "Tidaaak tidak, tidak, tidak", tetapi saya bukan ahli dan saya akan tertarik membaca beberapa argumen itu.
Matt Parker
4
Anda yakin tidak bisa mempercayai nilai-p yang diperoleh dari distribusi F dengan jenis data seperti itu!
whuber
3
Banyak yang mengutip kekokohan ANOVA sebagai pembenaran untuk menggunakannya dengan data yang tidak normal. IMHO, ketahanan bukan atribut umum dari suatu tes, tetapi Anda harus secara tepat menyatakan a) terhadap pelanggaran asumsi mana tes itu kuat (normalitas, kebulatan, ...), b) sampai sejauh mana pelanggaran ini tidak memiliki besar efek, c) apa prasyarat untuk tes untuk menunjukkan ketahanan (ukuran sel besar & sama ...). Dalam desain petak-ganda Anda, saya ingin seseorang menyatakan asumsi yang tepat tentang kebulatan & kesetaraan matriks kovarian. Ini sudah membingungkan dalam kasus 2-faktorial.
caracal
3
@ Mat Kedengarannya seperti 90% dari residual adalah nol. Jika itu masalahnya, tidak ada transformasi yang akan membuat residu dari jarak dekat menjadi normal. Studi simulasi menunjukkan bahwa nilai-p dari uji-F sangat sensitif terhadap penyimpangan dari normalitas. (Dalam kasus Anda, cukup mungkin bahwa beberapa penyebut dalam F-tes akan menjadi nol: indikator yang tajam tentang seberapa jauh hal-hal bisa salah.) Anda memerlukan pendekatan yang berbeda. Apa yang harus dilakukan tergantung pada mengapa begitu banyak residual adalah nol. Kurangnya presisi dalam pengukuran?
Whuber
2
@Mat itu kedengarannya lebih tepat, dengan asumsi data Anda dianggap penting Pertimbangan menarik lainnya adalah respons binomial negatif nol yang meningkat ( ats.ucla.edu/stat/r/dae/zinbreg.htm ).
Whuber

Jawaban:

20

Seperti tes parametrik lainnya, analisis varian mengasumsikan bahwa data sesuai dengan distribusi normal. Jika variabel pengukuran Anda tidak terdistribusi secara normal, Anda mungkin meningkatkan peluang hasil positif palsu jika Anda menganalisis data dengan anova atau tes lain yang mengasumsikan normalitas. Untungnya, anova tidak terlalu sensitif terhadap penyimpangan moderat dari normalitas; studi simulasi, menggunakan berbagai distribusi non-normal, telah menunjukkan bahwa tingkat positif palsu tidak banyak dipengaruhi oleh pelanggaran asumsi ini (Glass et al. 1972, Harwell et al. 1992, Lix et al. 1996). Ini karena ketika Anda mengambil sejumlah besar sampel acak dari suatu populasi, rata-rata sampel tersebut terdistribusi secara normal bahkan ketika populasinya tidak normal.

Dimungkinkan untuk menguji good-of-fit dari suatu set data dengan distribusi normal. Saya tidak menyarankan Anda melakukan ini, karena banyak set data yang secara signifikan tidak normal akan sangat cocok untuk anova.

Sebaliknya, jika Anda memiliki kumpulan data yang cukup besar, saya sarankan Anda hanya melihat histogram frekuensi. Jika terlihat lebih atau kurang normal, silakan dan lakukan anova. Jika terlihat seperti distribusi normal yang didorong ke satu sisi, seperti data sulfat di atas, Anda harus mencoba transformasi data yang berbeda dan melihat apakah ada di antaranya yang membuat histogram terlihat lebih normal. Jika itu tidak berhasil, dan data masih terlihat sangat tidak normal, mungkin masih oke untuk menganalisis data menggunakan anova. Namun, Anda mungkin ingin menganalisisnya menggunakan tes non-parametrik. Hampir setiap uji statistik parametrik memiliki pengganti non-parametrik, seperti uji Kruskal-Wallis alih-alih anova satu arah, uji peringkat bertanda Wilcoxon alih-alih uji t berpasangan, dan korelasi peringkat Spearman alih-alih regresi linier. Tes non-parametrik ini tidak mengasumsikan bahwa data sesuai dengan distribusi normal. Mereka berasumsi bahwa data dalam kelompok yang berbeda memiliki distribusi yang sama satu sama lain, namun; jika kelompok yang berbeda memiliki distribusi bentuk yang berbeda (misalnya, satu condong ke kiri, yang lain condong ke kanan), tes non-parametrik mungkin tidak lebih baik daripada yang parametrik.

Referensi

  1. Glass, GV, PD Peckham, dan JR Sanders. 1972. Konsekuensi kegagalan untuk memenuhi asumsi yang mendasari analisis efek tetap varians dan kovarian. Pdt. Educ. Res. 42: 237-288.
  2. Harwell, MR, EN Rubinstein, WS Hayes, dan CC Olds. 1992. Meringkas hasil Monte Carlo dalam penelitian metodologis: satu-dua faktor efek tetap kasus ANOVA. J. Educ. Stat. 17: 315-339.
  3. Lix, LM, JC Keselman, dan HJ Keselman. 1996. Konsekuensi pelanggaran asumsi ditinjau kembali: Tinjauan kuantitatif alternatif untuk analisis satu arah uji varians F. Pdt. Educ. Res. 66: 579-619.
rolando2
sumber
7
Saya mungkin hanya menunjukkan ketidaktahuan saya di sini, tetapi bukankah asumsi di balik ANOVA bahwa residualnya normal? Dalam kasus itu, tidak masalah jika variabel itu sendiri tidak normal, selama residualnya sesuai dengan pola.
richiemorrisroe
5
Mungkin pertanyaannya sudah diedit, tetapi saya benar-benar tidak mengerti mengapa jawaban ini dibalik dan diterima. Ini adalah saran umum yang layak, tetapi hampir tidak ada hubungannya dengan kasus khusus ini "Kemiringan dan kurtosis adalah hasil dari 90% dari tingkat kesalahan berarti menjadi 0". Dalam hal ini jawabannya adalah tidak, tidak, dan tidak.
Erik
8

Khususnya mengenai tingkat kesalahan sebagai DV, Dixon (2008) sangat meyakinkan menunjukkan bahwa pengujian hipotesis nol melalui ANOVA dapat menyebabkan peningkatan tingkat alarm palsu (memanggil efek "signifikan" ketika mereka tidak) dan meningkatkan tingkat kesalahan (kehilangan efek nyata). Dia juga menunjukkan bahwa pemodelan efek campuran, yang menentukan kesalahan terdistribusi secara binerial, adalah pendekatan yang lebih tepat untuk menganalisis data laju.

Mike Lawrence
sumber
4

Anda tidak dapat mempercayai ANOVA Anda dengan banyak kemiringan dan sejumlah besar 0s. Metode yang lebih tepat adalah dengan menggunakan jumlah kesalahan sebagai DV Anda (sehingga mengubah DV Anda menjadi data jumlah) dan melakukan analisis Poisson. Pendekatan ini akan memerlukan menggunakan analisis efek campuran dan menentukan keluarga distribusi kesalahan sebagai Poisson. The Dixon (2008) * artikel yang disebutkan oleh Mike Lawrence menggunakan analisis efek campuran dalam R tetapi dengan hasil binomial. Saya telah sepenuhnya pindah untuk melakukan R untuk sebagian besar analisis pengukuran berulang saya karena begitu banyak variabel hasil saya adalah binomial. Paket R yang sesuai adalah lme4.

Mike Young
sumber
2

Juan telah menawarkan banyak hal, walaupun saya akan menggemakan yang lain dan mengulangi bahwa untuk akurasi terbaik variabel-variabel itu sendiri bisa menjadi tidak normal asalkan residunya tidak. Juga, jawaban yang disederhanakan dan sedikit lebih terstruktur (melalui bagan alur beranotasi) tersedia di yellowbrickstats.com .

rolando2
sumber
1
Maaf, tapi -1 dari saya. Ini berlaku secara umum, tetapi residu tidak akan terjadi jika kita memiliki inflasi nol. Saya pikir jawaban tidak hanya mencakup generalisasi tetapi juga mengatasi masalah tertentu.
Erik
1

Efek langit-langit adalah masalahnya di sini. Tes non parametrik adalah taruhan Anda yang paling aman, meskipun ANOVA kuat terhadap pelanggaran normalitas ini jika n besar. Biasanya orang hanya menggunakan histogram untuk menguji ini, tetapi jika masalahnya ada pada residual, mungkin lebih maju dari itu. Juga ingat BAGAIMANA ini memengaruhi hasil Anda (tidak hanya itu). Pallant (2007) mungkin akan mengatakan ini meningkatkan peluang Anda kesalahan tipe satu, jadi jika Anda mengurangi alpha kritis Anda, Anda mengurangi itu.

james
sumber