Jika saya tahu bahwa populasi terdistribusi secara normal, dan kemudian mengambil sampel kecil dari populasi ini, apakah lebih tepat untuk mengklaim bahwa distribusi samplingnya normal atau malah mengikuti distribusi t ?
Saya mengerti bahwa sampel kecil cenderung didistribusikan, tetapi apakah ini hanya berlaku ketika distribusi populasi yang mendasarinya tidak diketahui?
Terima kasih!
Jawaban:
1) satu set pengamatan acak dari populasi dengan distribusiF adalah sampel dari distribusi itu. Jadi, bahkan nilai tunggal yang diambil sampel dari populasi normal terdistribusi secara normal. (Yah, berbicara sedikit lebih ketat, variabel acak yang mewakili undian tunggal adalah hal yang biasanya didistribusikan.)
2) Jika pengamatan independen diambil dari distribusi normal, berarti sampel normal. (Jika mereka tergantung, itu penting apa struktur ketergantungan itu.)
3) Berikut adalah sesuatu yang akan didistribusikan-t, jika datanya diambil dari populasi normal: t-statistik. (Kami mendapatkan sesuatu selain dari normal karena ada pembilang dan penyebut)
Ini adalah pemahaman yang salah. Atas dasar apa pengertian ini?
[Ini sepertinya kesalahpahaman yang umum sehingga saya hanya bisa berasumsi itu ada di buku populer atau yang pernah populer di suatu tempat. Jika Anda menemukan buku seperti itu, poskan detail di pertanyaan Anda atau di komentar, karena saya ingin tahu dari mana asalnya.]
sumber
Jika Anda bermaksud mengambil nilai dari populasi yang terdistribusi normal, nilai itu memiliki fungsi kepadatan probabilitas yang sama dengan populasi. Jadi undian sajaxi dari suatu populasi X∼N(μ,σ2) akan diambil dari distribusi populasi yang sama N(μ,σ2)
Jadi itu berarti sampel kecil masih didistribusikan Normal, kan? Ya, tentu saja, bahwa jika setiap undian berasal dari distribusi Normal, itu sendiri akan memiliki distribusi Normal (sebelum kita benar-benar mengambil undian, setidaknya).
Sepertinya Anda bertanya tentangx¯ , karena kita berbicara tentang sampel, distribusi t, dan sejenisnya. x¯ xi memiliki distribusi normal. Mengapa? Karena itu hanya jumlah variabel acak normal lainnya!
bukanmasih Normal untuk sampel kecil,meskipunkarena setiap pengamatanGlen_b membuat tangkapan yang bagus di tempat saya bergabungx¯ dan t -statistik. Penting untuk dicatat bahwa sementarax¯ masih Normal untuk ukuran sampel apa pun (jika populasi sampelnya adalah Normal), t statistik yang dibangun dari sampel Normal bukan Normal untuk ukuran sampel kecil. Mengapa?
Kami punya dua kasus berbeda di sini. Ada kemungkinan bahwa distribusi sudah diketahui, dalam hal ini kita tahu nilai sebenarnya dariσ2 . Mungkin juga ituσ2 tidak diketahui, dalam hal ini kita harus memperkirakannya.
1: Kami tahuσ2 . Ini berarti kita dapat menggunakan az statistik dihitung langsung dari parameter populasi σ2 .
Jika kita yakin tentang nilai sebenarnya dariσ2 , maka kita dapat melakukan mis pengujian hipotesis pada x¯ menggunakan distribusi N(μ,σ2n√) . Secara khusus, kita dapat membakukannya, mengubahnya menjadi nilaiZ , untuk distribusi yang mana N(0,1) Dan jika kita tahu nilainya σ2 , maka kita cukup menggunakan distribusi Normal Normal untuk perhitungan kita. Normal, tidak peduli seberapa besar atau kecil sampel kami!
2: Kami tidak tahuσ2 , dan kami memperkirakannya dengan s2 .
Jika kita tidak tahuσ2 , maka kita perlu mengganti nilai yang dihitung dari penduga dengan nilai populasi sebenarnya. Biasanya, itu akan terjadis2 , varians sampel. Tetapi varians sampel memiliki distribusinya sendiri juga! Jadi kita sebenarnya tidak yakin tentang nilainya. Dan jika ukuran sampel kami kecil, maka 'varians dari sampel varians' cukup signifikan untuk mempengaruhi carax¯ didistribusikan. Jadi ketika kita melakukan standarisasix¯ , itu tidak terdistribusi secara normal lagi, meskipun semuanya xi yang masuk ke penghitungan itu didistribusikan Normal.
Untuk informasi lebih lanjut, baca tentang definisi distribusi-t , dan distribusi varian sampel .
sumber