Bagaimana kita bisa mendapatkan distribusi normal sebagai

12

Katakanlah kita memiliki variabel acak dengan rentang nilai yang dibatasi oleh dan b , di mana a adalah nilai minimum dan b nilai maksimum.abab

Saya diberitahu bahwa sebagai , di mana n adalah ukuran sampel kami, distribusi sampling berarti sampel kami adalah distribusi normal. Artinya, seperti yang kita meningkatkan n kita lebih dekat dan lebih dekat dengan distribusi normal, tetapi batas yang sebenarnya sebagai n adalah sama untuk distribusi normal.nnnn

Namun, bukankah bagian dari definisi distribusi normal yang harus diperluas dari ke ?

Jika maks kisaran kami adalah , maka rata-rata sampel maksimum (terlepas dari ukuran sampel) akan sama dengan b , dan rata-rata sampel minimum sama dengan a .bba

Jadi sepertinya bagi saya bahwa bahkan jika kita mengambil batas ketika mendekati tak terhingga, distribusi kita bukanlah distribusi normal yang sebenarnya, karena dibatasi oleh a dan b .nab

Apa yang saya lewatkan ?

jeremy radcliff
sumber

Jawaban:

15

Inilah yang Anda lewatkan. Distribusi asimptotik bukan dari (mean sampel), tetapi dari X¯n, di manaθadalah mean dariX.n(X¯nθ)θX

Misalkan menjadi iid variabel acak sedemikian sehingga a < X i < b dan X i memiliki mean θ dan varians σ 2 . Dengan demikian X i telah terikat dukungan. CLT mengatakan bahwa X1,X2,a<Xi<bXiθσ2Xi

n(X¯nθ)dN(0,σ2),

di mana adalah mean sampel. SekarangX¯n

a<Xi<ba<X¯n<baθ<X¯nθ<bθn(aθ)<n(X¯nθ)<n(bθ).

Seperti , batas bawah dan batas atas cenderung masing-masing - dan , dan dengan demikian sebagai n dukungan nnadalah persis seluruh garis nyata.n(X¯nθ)

Setiap kali kita menggunakan CLT dalam praktiknya, kita katakan , dan ini akan selalu menjadi perkiraan.X¯nN(θ,σ2/n)


EDIT: Saya pikir bagian dari kebingungan adalah dari salah tafsir dari Central Limit Theorem. Anda benar bahwa distribusi sampling dari mean sampel adalah

X¯nN(θ,σ2/n).

Namun, distribusi sampling adalah properti sampel hingga. Seperti yang Anda katakan, kami ingin membiarkan ; setelah kami melakukannya tanda akan menjadi hasil yang tepat. Namun, jika kita membiarkan n , kita tidak dapat lagi memiliki n di sisi kanan (karena n sekarang ). Jadi pernyataan berikut ini salah ˉ X n d N ( θ , σ 2 / n )  sebagai  n .nnnn

X¯ndN(θ,σ2/n) as n.

dn

n(X¯nθ)dN(0,σ2)

Untuk melihat bagaimana aljabar bekerja, lihat jawabannya di sini .

Greenparker
sumber
X¯nn(X¯nθ)nX¯nnn(X¯nθ)X¯n
Z
@ jeremyradcliff Saya telah mengedit jawaban saya, dan menyertakan tautan yang menjelaskan beberapa detail. Semoga ini lebih masuk akal sekarang.
Greenparker
1
n
7

Jika Anda merujuk pada teorema batas pusat, perhatikan bahwa salah satu cara yang tepat untuk menuliskannya adalah

(x¯μσ)ndN(0,1)

μ,σxi

n

nnn

XiBern(p=0.5)

X¯˙N(p,p(1p)n)

n

P(N(p,p(1p)n)<0)>0

n

P(N(p,p(1p)n)<0)0

Sehingga ketidaksesuaian antara distribusi aktual dan distribusi perkiraan yang menghilang, seperti yang seharusnya terjadi dengan perkiraan.

Cliff AB
sumber