Saya menguji persamaan cara menggunakan uji-t Welch. Distribusi yang mendasarinya jauh dari normal (lebih condong daripada contoh dalam diskusi terkait di sini ). Saya dapat memperoleh lebih banyak data tetapi ingin beberapa cara berprinsip untuk menentukan sejauh mana melakukannya.
- Apakah ada heuristik yang baik untuk membuat penilaian bahwa distribusi sampel dapat diterima? Penyimpangan manakah dari normalitas yang paling memprihatinkan?
- Apakah ada pendekatan lain - misalnya mengandalkan interval kepercayaan bootstrap untuk statistik sampel - yang akan lebih masuk akal?
Jawaban:
Karena uji t mengasumsikan normal, dan distribusi yang mendasarinya tidak normal, tidak mungkin ada cara berprinsip untuk menentukan bahwa distribusi sampel dapat diterima. Namun, ketika ukuran sampel menjadi "besar", Teorema Limit Sentral dimulai, dan Anda dapat menggunakan uji-z sampel besar, yang pada dasarnya akan memberi Anda jawaban yang sama dengan uji- t karena uji t mendekati distribusi normal dengan sampel besar.
Buku / kursus Stats sering menyiratkan bahwa pada ukuran sampel 25 atau 30 CLT berperan penting. Namun, pengalaman saya adalah bahwa bahkan dengan ukuran sampel dalam ratusan sampel besar z-tes masih bisa sangat buruk (misalnya, dengan data jumlah).
Menurut pendapat saya, tes permutasi cocok untuk masalah Anda. Seharusnya memiliki kekuatan yang sama atau lebih baik daripada tes nonparametrik kalengan (misalnya, Mann-Whitney) dan Anda tidak perlu khawatir tentang masalah normalitas. Dan, mereka menyenangkan untuk menulis.
sumber