Saya telah membaca tentang uji-t Student tetapi tampaknya berfungsi ketika kita dapat berasumsi bahwa distribusi asli terdistribusi secara normal. Dalam kasus saya, mereka pasti tidak.
Juga, jika saya memiliki 13 distribusi, apakah saya perlu melakukan 13^2
tes?
r
hypothesis-testing
distributions
Martin Velez
sumber
sumber
Jawaban:
Ada beberapa pengertian di mana "itu tergantung".
(Satu kekhawatiran potensial adalah bahwa sepertinya data asli mungkin terpisah; yang harus diklarifikasi.)
tergantung pada ukuran sampel, ketidaknormalan mungkin tidak menjadi masalah besar seperti semua untuk uji-t. Untuk sampel besar setidaknya umumnya tingkat ketahanannya bagus - Tingkat kesalahan tipe I seharusnya tidak terlalu buruk jika tidak jauh dari normal. Kekuasaan mungkin lebih merupakan masalah dengan ekor yang berat.
Jika Anda mencari segala jenis perbedaan dalam distribusi, uji goodness of fit dua sampel, seperti tes dua sampel Kolmogorov-Smirnov mungkin cocok (meskipun tes lain mungkin dilakukan sebagai gantinya).
Jika Anda mencari perbedaan tipe lokasi di keluarga lokasi, atau perbedaan skala dalam keluarga skala, atau bahkan hanya hubungan tipe P (X> Y)> P (Y> X), Wilcoxon-Mann-Whitney dua uji sampel mungkin cocok.
Anda dapat mempertimbangkan pengujian ulang tes seperti permutasi atau tes bootstrap, jika Anda dapat menemukan statistik yang cocok untuk jenis perbedaan yang ingin Anda sadari.
Ya tidak .
Pertama, Anda tidak perlu menguji vs dan vs (perbandingan kedua redundan).SEBUAH B B SEBUAH
Kedua, Anda tidak perlu tes vs .SEBUAH SEBUAH
Kedua hal itu memotong perbandingan berpasangan turun dari 169 menjadi 78.
Ketiga, akan jauh lebih biasa (tetapi tidak wajib) untuk menguji secara kolektif untuk setiap perbedaan, dan kemudian, mungkin untuk melihat perbedaan berpasangan dalam tes berpasangan post-hoc jika nol pertama ditolak.
Misalnya, sebagai pengganti Wilcoxon-Mann-Whitney seperti pada butir 3. di atas, orang mungkin melakukan tes Kruskal-Wallis, yang peka terhadap perbedaan lokasi di antara kelompok.
Ada juga versi k-sampel dari uji Kolmogorov-Smirnov , dan tes serupa dari beberapa sampel uji kecocokan dua sampel lainnya mungkin ada, atau dibangun.
Ada juga versi k-sampel tes resampling, dan uji-t (yaitu ANOVA, yang mungkin oke jika ukuran sampel cukup besar).
Akan sangat menyenangkan untuk mendapatkan lebih banyak informasi tentang apa yang sedang kita hadapi dan perbedaan apa yang paling Anda minati; atau gagal itu, untuk melihat plot QQ dari beberapa sampel.
sumber
Ya, saya pikir Anda tidak dapat melakukan lebih baik daripada menguji setiap distribusi terhadap yang lain ...
Jika berpikir bahwa pertanyaan Anda terkait dengan yang ini: Perbandingan 2 distribusi
Anda menyarankan Anda untuk menggunakan tes Kolmogorov-Sminorv atau tes Cramér-Von Mises. Keduanya adalah tes kecukupan yang sangat klasik.
Dalam
R
, fungsiks.test
dalam paket statistik mengimplementasikan yang pertama. Yang kedua dapat ditemukan dalam paket-paket seperticramer
.Untuk mempelajari dua tes ini: http://en.wikipedia.org/wiki/Kolmogorov%E2%80%93Smirnov_test http://en.wikipedia.org/wiki/Cram%C3%A9r%E2%80%93von_Mises_criterion
sumber
Anda dapat mencoba analisis varian satu arah Kruskal – Wallis
"Digunakan untuk membandingkan lebih dari dua sampel yang independen, atau tidak terkait"
Pelanggaran normalitas di ANOVA dibahas dalam
Rutherford Introducing Anova and Ancova: A GLM Approach 9.1.2 Pelanggaran normalitas
Baris pertama adalah "Meskipun sebagian besar sumber melaporkan ANOVA ... sebagai kuat sehubungan dengan pelanggaran asumsi normalitas ..."
sumber