Saya memiliki serangkaian hasil dari uji A / B (satu grup kontrol, satu grup fitur) yang tidak sesuai dengan Distribusi Normal. Bahkan distribusi lebih menyerupai Distribusi Landau.
Saya percaya uji-t independen mensyaratkan bahwa sampel harus setidaknya terdistribusi secara normal, yang menghambat saya menggunakan uji-t sebagai metode pengujian signifikansi yang valid.
Tetapi pertanyaan saya adalah: Pada titik mana seseorang dapat mengatakan bahwa uji-t bukanlah metode pengujian signifikan yang baik?
Atau dengan kata lain, bagaimana seseorang bisa memenuhi syarat seberapa andal nilai-p dari suatu uji-t, hanya diberikan set data?
sumber
Pada dasarnya uji-t independen atau uji-2 sampel digunakan untuk memeriksa apakah rata-rata dari kedua sampel berbeda secara signifikan. Atau, dengan kata lain, jika ada perbedaan yang signifikan antara rata-rata dari dua sampel.
Sekarang, rata-rata dari 2 sampel tersebut adalah dua statistik, yang menurut CLT, memiliki distribusi normal, jika disediakan sampel yang cukup. Perhatikan bahwa CLT berfungsi terlepas dari distribusi dari mana statistik rata-rata dibuat.
Biasanya seseorang dapat menggunakan z-test, tetapi jika varians diperkirakan dari sampel (karena tidak diketahui), beberapa ketidakpastian tambahan diperkenalkan, yang dimasukkan dalam distribusi t. Itu sebabnya uji-2-sampel berlaku di sini.
sumber