Penasaran dengan pertanyaan di math.stackexchange , dan menyelidikinya secara empiris, saya bertanya-tanya tentang pernyataan berikut tentang akar kuadrat jumlah variabel acak iid.
Misalkan adalah variabel acak iid dengan rerata nol dan varians , dan . Teorema batas pusat mengatakan ketika meningkat. μ σ 2 Y = n ∑ i = 1 X i Y - n μn
Jika , dapatkah saya juga mengatakan sesuatu seperti saat bertambah?Z - √n
Sebagai contoh, misalkan adalah Bernoulli dengan rata-rata dan varians , maka adalah binomial dan saya dapat mensimulasikan ini dalam R, katakan dengan : p p ( 1 - p ) Y p = 1
set.seed(1)
cases <- 100000
n <- 1000
p <- 1/3
Y <- rbinom(cases, size=n, prob=p)
Z <- sqrt(abs(Y))
yang memberikan kira-kira harapan-untuk mean dan varians untuk
> c(mean(Z), sqrt(n*p - (1-p)/4))
[1] 18.25229 18.25285
> c(var(Z), (1-p)/4)
[1] 0.1680012 0.1666667
dan plot QQ yang terlihat dekat dengan Gaussian
qqnorm(Z)
Jawaban:
Konvergensi ke Gaussian memang fenomena umum.
Misalkan adalah variabel acak IID dengan mean dan varians , dan tentukan jumlah . Perbaiki angka . Teorema Limit Pusat biasa memberi tahu kita bahwa sebagai , di mana adalah cdf normal standar. Namun, kesinambungan cdf pembatas menyiratkan bahwa kami juga memilikiX1,X2,X3,... μ>0 σ2 Yn=∑ni=1Xi α P(Yn−nμσn√≤α)→Φ(α) n→∞ Φ
Mengambil akar kuadrat, dan mencatat bahwa menyiratkan bahwa , kita memperoleh Dengan kata lain, . Hasil ini menunjukkan konvergensi ke Gaussian dalam batas sebagai .μ>0 P(Yn<0)→0
Apakah ini berarti bahwa adalah perkiraan yang baik untuk untuk besar ? Ya, kita bisa melakukan yang lebih baik dari ini. Seperti yang dicatat oleh @Henry, dengan asumsi semuanya positif, kita dapat menggunakan , bersama dengan dan aproksimasi , untuk mendapatkan perkiraan aproksimasi seperti yang dinyatakan dalam pertanyaan di atas. Perhatikan juga bahwa kita masih memiliki karenanμ−−−√ E[|Yn|−−−√] n E[Yn−−√]=E[Yn]−Var(Yn−−√)−−−−−−−−−−−−−−−√ E[Yn]=nμ Var(Yn−−√)≈σ24μ E[|Yn|−−−√]≈nμ−σ24μ−−−−−−−√
sumber