Teorema Limit Sentral untuk akar kuadrat dari jumlah variabel acak iid

11

Penasaran dengan pertanyaan di math.stackexchange , dan menyelidikinya secara empiris, saya bertanya-tanya tentang pernyataan berikut tentang akar kuadrat jumlah variabel acak iid.

Misalkan adalah variabel acak iid dengan rerata nol dan varians , dan . Teorema batas pusat mengatakan ketika meningkat. μ σ 2 Y = n i = 1 X i Y - n μX1,X2,,Xnμσ2Y=i=1nXinYnμnσ2 d N(0,1)n

Jika , dapatkah saya juga mengatakan sesuatu seperti saat bertambah?Z - Z=|Y|nZn|μ|σ24|μ|σ24|μ| d N(0,1)n

Sebagai contoh, misalkan adalah Bernoulli dengan rata-rata dan varians , maka adalah binomial dan saya dapat mensimulasikan ini dalam R, katakan dengan : p p ( 1 - p ) Y p = 1Xipp(1p)Yp=13

set.seed(1)
cases <- 100000
n <- 1000
p <- 1/3
Y <- rbinom(cases, size=n, prob=p)
Z <- sqrt(abs(Y))

yang memberikan kira-kira harapan-untuk mean dan varians untukZ

> c(mean(Z), sqrt(n*p - (1-p)/4))
[1] 18.25229 18.25285
> c(var(Z), (1-p)/4)
[1] 0.1680012 0.1666667

dan plot QQ yang terlihat dekat dengan Gaussian

qqnorm(Z)

masukkan deskripsi gambar di sini

Henry
sumber
1
@MichaelM: Terima kasih atas komentar itu. Saya sudah mulai dengan non-negatif, tetapi saya pikir perilaku asimptotik intuitif yang Anda uraikan memungkinkan generalisasi ke lebih banyak distribusi. Kejutan saya adalah (a) varians dari akar kuadrat dari jumlah yang tampaknya cenderung konstan tidak tergantung pada dan (b) penampilan distribusi yang terlihat sangat dekat dengan Gaussian. Contoh tandingan akan disambut baik, tetapi ketika saya mencoba kasus lain yang awalnya tampak non-Gaussian, semakin meningkat tampaknya membawa distribusi kembali ke hasil tipe CLT. Xinn
Henry
Sebuah akibat wajar dari ini adalah akar-mean-kuadrat (atau kuadrat rata-rata) dari variabel acak iid sesuai skala (dikalikan dengan seperti dengan rata-rata aritmatika) juga menyatu dengan distribusi Gaussian asalkan momen ke- dari distribusi yang mendasarinya terbatas. n4
Henry
3
Hanya komentar singkat: klaim adalah kasus khusus dari metode Delta, lihat Teorema 5.5.24 dalam buku "Statistik inferensi" oleh Casella & Berger.
Michael M
@Michael: Mungkin Anda melihat sesuatu yang bukan saya saat ini, tetapi saya tidak berpikir masalah khusus ini sesuai dengan asumsi metode Delta klasik (misalnya, sebagaimana dinyatakan dalam teorema yang Anda referensi). Perhatikan bahwa tidak konvergen dalam distribusi (nontrivial pada ) dan karenanya "menerapkan metode Delta dengan " tidak memenuhi persyaratan yang dipersyaratkan. Namun, seperti yang ditunjukkan oleh jawaban S. Catterall, ini memberikan heuristik yang berguna yang mengarah pada jawaban yang benar. YRg(y)=|y|
kardinal
(Saya percaya Anda dapat mengadaptasi bukti metode Delta ke kasus yang mirip dengan di atas untuk membuat sepenuhnya heuristik yang disebutkan di atas.)
kardinal

Jawaban:

14

Konvergensi ke Gaussian memang fenomena umum.

Misalkan adalah variabel acak IID dengan mean dan varians , dan tentukan jumlah . Perbaiki angka . Teorema Limit Pusat biasa memberi tahu kita bahwa sebagai , di mana adalah cdf normal standar. Namun, kesinambungan cdf pembatas menyiratkan bahwa kami juga memilikiX1,X2,X3,...μ>0σ2Yn=i=1nXiαP(Ynnμσnα)Φ(α)nΦ

P(Ynnμσnα+α2σ24μσn)Φ(α)
karena istilah tambahan di sisi kanan ketidaksetaraan cenderung nol. Menyusun ulang ungkapan ini mengarah ke
P(Yn(ασ2μ+nμ)2)Φ(α)

Mengambil akar kuadrat, dan mencatat bahwa menyiratkan bahwa , kita memperoleh Dengan kata lain, . Hasil ini menunjukkan konvergensi ke Gaussian dalam batas sebagai .μ>0P(Yn<0)0

P(|Yn|ασ2μ+nμ)Φ(α)
|Yn|nμσ/2μdN(0,1)n

Apakah ini berarti bahwa adalah perkiraan yang baik untuk untuk besar ? Ya, kita bisa melakukan yang lebih baik dari ini. Seperti yang dicatat oleh @Henry, dengan asumsi semuanya positif, kita dapat menggunakan , bersama dengan dan aproksimasi , untuk mendapatkan perkiraan aproksimasi seperti yang dinyatakan dalam pertanyaan di atas. Perhatikan juga bahwa kita masih memiliki karenanμE[|Yn|]nE[Yn]=E[Yn]Var(Yn)E[Yn]=nμVar(Yn)σ24μE[|Yn|]nμσ24μ

|Yn|nμσ24μσ/2μdN(0,1)
nμσ24μnμ0 sebagai .n
S. Catterall Reinstate Monica
sumber
Anda mungkin perlu menambahkan sebagai untuk mendapatkan hasil sayanμnμσ24μ0n
Henry
@Henry Anda dapat mengganti dengan untuk konstanta dan ini tidak akan mengubah distribusi pembatas, tetapi ini dapat mengubah derajat adalah perkiraan yang baik untuk untuk besar yang spesifik . Bagaimana Anda menghasilkan ? nμnμkk|Yn|nμkσ/2μN(0,1)nnμσ24μ
S. Catterall Reinstate Monica
Kami memiliki jadi . Dengan asumsi semuanya positif, sedangkan penyebut menyarankan , dan menggabungkan lead ini ke . Var(Z)=E[Z2](E[Z])2E[Z]=E[Z2]Var(Z)E[Z2]=E[Y]=nμ|Yn|nμσ/2μ E[Z]Var(Z)σ24μE[Z]nμσ24μ
Henry
Ok, terima kasih, saya sudah mencoba membahas ini dalam jawaban saya sekarang.
S. Catterall Reinstate Monica