Untuk uji-t, menurut kebanyakan teks ada asumsi bahwa data populasi terdistribusi secara normal. Saya tidak mengerti mengapa demikian. Bukankah uji-t hanya mensyaratkan bahwa distribusi sampling dari sampel berarti terdistribusi secara normal, dan bukan pada populasi?
Jika itu adalah kasus bahwa uji-t hanya pada akhirnya memerlukan normalitas dalam distribusi sampling, populasi dapat terlihat seperti distribusi apa pun, bukan? Selama ada ukuran sampel yang masuk akal. Bukankah itu yang dinyatakan oleh teorema batas pusat?
(Saya merujuk di sini untuk satu-sampel atau sampel-independen t-tes)
Jawaban:
Statistik-t terdiri dari rasio dua kuantitas, kedua variabel acak. Itu tidak hanya terdiri dari pembilang.
Agar t-statistik memiliki distribusi t, Anda tidak perlu hanya bahwa mean sampel memiliki distribusi normal. Kamu juga membutuhkan:
bahwa dalam penyebut menjadi sedemikian sehingga s 2 / σ 2 ∼ χ 2 d *s s2/σ2∼χ2d
bahwa pembilang dan penyebut bersifat independen.
* (nilai tergantung pada tes mana - dalam satu sampel t kita memiliki d = n - 1 )d t d= n - 1
Agar ketiga hal tersebut benar-benar benar, Anda perlu agar data asli didistribusikan secara normal.
Mari kita ambil iid seperti yang diberikan sejenak. Agar CLT dapat menahan populasi harus sesuai dengan kondisi ... - populasi harus memiliki distribusi yang menerapkan CLT. Jadi tidak, karena ada distribusi populasi yang CLT tidak berlaku.
Tidak, CLT sebenarnya tidak mengatakan sepatah kata pun tentang "ukuran sampel yang masuk akal".
Sebenarnya tidak mengatakan apa-apa tentang apa yang terjadi pada ukuran sampel hingga.
Jadi, Anda memiliki masalah kembar:
A. Efek yang biasanya orang kaitkan dengan CLT - pendekatan yang semakin dekat dengan normalitas distribusi sampel berarti pada ukuran sampel kecil / sedang - sebenarnya tidak dinyatakan dalam CLT **.
B. "Sesuatu yang tidak jauh dari normal dalam pembilang" tidak cukup untuk membuat statistik memiliki distribusi-t
** (Sesuatu seperti teorema Berry-Esseen membuat Anda lebih menyukai apa yang dilihat orang ketika mereka melihat efek peningkatan ukuran sampel pada distribusi mean sampel.)
sumber