Bagaimana cara menguji normalitas dalam ANOVA 2x2?

8

Desain Studi: Saya menunjukkan kepada peserta beberapa informasi tentang kenaikan permukaan laut, memfokuskan informasi dengan cara yang berbeda, baik dalam hal skala waktu dan besarnya potensi kenaikan. Jadi saya punya 2 (Waktu: 2050 atau 2100) dengan 2 (Magnitude: Medium atau High) desain. Ada juga dua kelompok kontrol yang tidak menerima informasi, hanya menjawab pertanyaan untuk DV saya.

Pertanyaan: Saya selalu memeriksa normalitas di dalam sel - untuk bagian 2x2 dari desain ini, itu berarti mencari normalitas dalam 4 grup. Namun, membaca beberapa diskusi di sini telah membuat saya menebak metode saya.

Pertama, saya telah membaca bahwa saya harus melihat normalitas residu. Bagaimana saya bisa memeriksa normalitas residu (di SPSS atau di tempat lain)? Apakah saya harus melakukan ini untuk masing-masing dari 4 kelompok (6 termasuk kontrol)?

Saya juga membaca bahwa normalitas dalam kelompok menyiratkan normalitas residual. Apakah ini benar? (Referensi literatur?) Sekali lagi, apakah ini berarti melihat masing-masing dari 4 sel secara terpisah?

Singkatnya, langkah apa yang akan Anda ambil untuk menentukan apakah data (2x2) Anda tidak melanggar asumsi normalitas?

Referensi selalu dihargai, bahkan jika hanya untuk mengarahkan saya ke arah yang benar.

Lee
sumber

Jawaban:

6

Sebagian besar paket statistik memiliki cara untuk menyimpan residu dari model Anda. Menggunakan GLM - UNIVARIATEdi SPSS Anda dapat menyimpan residu. Ini akan menambahkan variabel ke file data Anda yang mewakili sisa untuk setiap pengamatan.

Setelah Anda memiliki residu, Anda dapat memeriksanya untuk melihat apakah residu tersebut terdistribusi normal, homoscedastik, dan sebagainya. Misalnya, Anda dapat menggunakan tes normalitas formal pada variabel residu Anda atau mungkin lebih tepat, Anda dapat merencanakan residu untuk memeriksa setiap penyimpangan besar dari normalitas. Jika Anda ingin memeriksa homoseksualitas, Anda bisa mendapatkan plot yang melihat residu berdasarkan kelompok.

Untuk dasar antara subyek faktorial ANOVA, di mana homogenitas varians berlaku, normalitas dalam sel berarti normalitas residual karena model Anda dalam ANOVA adalah untuk memprediksi rata-rata kelompok. Dengan demikian, residual hanyalah perbedaan antara rata-rata kelompok dan data yang diamati.

Respon terhadap komentar di bawah ini:

  • Residual didefinisikan relatif terhadap prediksi model Anda. Dalam hal ini prediksi model Anda adalah cara sel Anda. Ini adalah cara berpikir yang lebih umum tentang pengujian asumsi jika Anda berfokus pada merencanakan residu daripada merencanakan rata-rata sel individu, bahkan jika dalam kasus khusus ini, mereka pada dasarnya sama. Misalnya, jika Anda menambahkan kovariat (ANCOVA), residu akan lebih tepat untuk diperiksa daripada distribusi di dalam sel.
  • Untuk keperluan pemeriksaan normalitas, residu terstandarisasi dan tidak standar akan memberikan jawaban yang sama. Residu terstandarisasi dapat berguna ketika Anda mencoba mengidentifikasi data yang tidak dimodelkan oleh data (yaitu, pencilan).
  • Homogenitas varian dan homoseksualitas berarti hal yang sama sejauh yang saya ketahui. Sekali lagi, adalah umum untuk memeriksa asumsi ini dengan membandingkan varians antar kelompok / sel. Dalam kasus Anda, apakah Anda menghitung varians dalam residu untuk setiap sel atau berdasarkan data mentah di setiap sel, Anda akan mendapatkan nilai yang sama. Namun, Anda juga dapat memplot residual pada sumbu y dan memperkirakan nilai pada sumbu x. Ini adalah pendekatan yang lebih umum karena juga berlaku untuk situasi lain seperti di mana Anda menambahkan kovariat atau Anda melakukan regresi berganda.
  • Suatu poin muncul di bawah ini bahwa ketika Anda memiliki heteroskedastisitas (yaitu, dalam varians sel bervariasi antara sel-sel dalam populasi) dan residu terdistribusi secara normal di dalam sel, distribusi yang dihasilkan dari semua residu akan menjadi non-normal. Hasilnya adalah distribusi campuran variabel dengan rata-rata nol dan varians berbeda dengan proporsi relatif terhadap ukuran sel. Distribusi yang dihasilkan tidak memiliki kemiringan nol, tetapi mungkin akan memiliki sejumlah kurtosis. Jika Anda membagi residu dengan standar deviasi sel-dalam yang sesuai, maka Anda dapat menghapus efek heteroskedastisitas; memplot residual yang dihasilkan akan memberikan tes keseluruhan apakah residu terdistribusi normal terlepas dari heteroskedastisitas.
Jeromy Anglim
sumber
Ah ya, saya melihat bagaimana cara menyelamatkan mereka. Saya berasumsi dari apa yang Anda katakan bahwa yang disimpan adalah residu berdasarkan kelompok - yaitu, perbedaan nilai sampel dari sel berarti, bukan mean besar. Haruskah saya memeriksa residu terstandarisasi atau tidak standar? Meskipun, mengapa memeriksa residu jika itu setara dengan memeriksa normalitas di dalam sel? Ini tentu saja lebih sederhana. Dan akhirnya, Anda menyebutkan homoseksualitas. Saya biasanya memeriksa homogenitas varians antara sel. Apakah ini sesuatu yang juga mungkin memerlukan pemeriksaan residu?
Lee
@Lee Oke. Saya telah mengedit jawaban saya untuk menanggapi komentar Anda.
Jeromy Anglim
+1, benar-benar ada banyak info bagus di sini. Satu catatan, saya mengalami masalah dalam menguraikan bagian poin ke-3 Anda, beberapa pengeditan mungkin membantu.
gung - Reinstate Monica
@ung Terima kasih atas umpan baliknya. Saya memberikan sedikit edit untuk mencoba membuat poin 3 sedikit lebih jelas.
Jeromy Anglim
Terima kasih; banyak info hebat di sini. Akan sulit untuk keluar dari kebiasaan saya melihat normalitas data mentah (di dalam sel), tetapi saya pasti akan memberikan pertimbangan residu untuk analisis masa depan.
Lee
3

Meskipun banyak buku pengantar yang menekankan hal itu, Anda tidak perlu Normalitas. Dengan ukuran sampel yang sederhana dan varians yang sama dalam masing-masing kelompok, yaitu homoskedastisitas, ANOVA akan memberikan inferensi yang akurat tentang perbedaan rata-rata respons antara kelompok. Jika ada alasan untuk menduga varians tidak konstan - dan mungkin ada - maka kesalahan standar heteroskedasticity-konsisten dapat digunakan.

Properti ini adalah ekstensi dari yang terkenal untuk uji-t; dengan varian konstan Anda dapat menggunakan uji-t "vanila polos", terlepas dari Normalitas (hasil diketahui oleh Fisher, jalan kembali) dan dengan varian non-konstan varian tidak sama juga berfungsi dengan baik tanpa Normality. Versi varians tidak sama dengan tes Wald yang menggunakan kesalahan standar yang konsisten heteroskedastisitas.

tamu
sumber
Apa yang membuat Anda mengatakan bahwa normalitas tidak masalah? Baik ANOVA dan t-test bisa sangat sensitif terhadap kemiringan. Jika distribusi yang mendasarinya asimetris, Anda tidak boleh menggunakan metode mana pun untuk ukuran sampel kecil.
MånsT
Saya akan sangat senang memeriksa referensi yang mendukung pernyataan ini, terutama yang terbaru. Namun tanpa referensi seperti itu saya harus bergantung pada sebagian besar buku teks.
Lee
2
Inilah satu referensi ; perhatikan bahwa mereka benar-benar mencoba untuk memecahkan metode, dengan contoh yang cukup ekstrim Dengan data yang tidak terlalu ekstrem, semuanya masih akan bekerja pada ukuran sampel sederhana. Anda juga dapat melihat teks klasik McCullagh dan Nelder pada model linier (umum), di mana mereka berhati-hati untuk menggambarkan regresi linier melalui model "varian konstan", karena ini adalah asumsi yang penting. Untuk kesalahan standar yang kuat, lihat teks ekonometrika intro; dokumentasi perangkat lunak STATA juga merupakan sumber yang baik.
tamu