Teorema Limit Sentral untuk akar kuadrat dari jumlah variabel acak iid

Penasaran dengan pertanyaan di math.stackexchange , dan menyelidikinya secara empiris, saya bertanya-tanya tentang pernyataan berikut tentang akar kuadrat jumlah variabel acak iid.

Misalkan adalah variabel acak iid dengan rerata nol dan varians , dan . Teorema batas pusat mengatakan ketika meningkat. $X_1, X_2, \ldots, X_n$ $\mu$ $\sigma^2$ $\displaystyle Y=\sum_{i=1}^n X_i$ $\displaystyle \dfrac{Y - n\mu}{\sqrt{n\sigma^2}} \ \xrightarrow{d}\ N(0,1)$ $n$

Jika , dapatkah saya juga mengatakan sesuatu seperti saat bertambah? $Z=\sqrt{|Y|}$ $\displaystyle \dfrac{Z - \sqrt{n |\mu|-\tfrac{\sigma^2}{4|\mu|}}}{\sqrt{\tfrac{\sigma^2}{4|\mu|}}}\ \xrightarrow{d}\ N(0,1)$ $n$

Sebagai contoh, misalkan adalah Bernoulli dengan rata-rata dan varians , maka adalah binomial dan saya dapat mensimulasikan ini dalam R, katakan dengan : $X_i$ $p$ $p(1-p)$ $Y$ $p=\frac13$

set.seed(1)
cases <- 100000
n <- 1000
p <- 1/3
Y <- rbinom(cases, size=n, prob=p)
Z <- sqrt(abs(Y))

yang memberikan kira-kira harapan-untuk mean dan varians untuk $Z$

> c(mean(Z), sqrt(n*p - (1-p)/4))
[1] 18.25229 18.25285
> c(var(Z), (1-p)/4)
[1] 0.1680012 0.1666667

dan plot QQ yang terlihat dekat dengan Gaussian

qqnorm(Z)

normal-distribution central-limit-theorem sum Henry
sumber

@MichaelM: Terima kasih atas komentar itu. Saya sudah mulai dengan non-negatif, tetapi saya pikir perilaku asimptotik intuitif yang Anda uraikan memungkinkan generalisasi ke lebih banyak distribusi. Kejutan saya adalah (a) varians dari akar kuadrat dari jumlah yang tampaknya cenderung konstan tidak tergantung pada dan (b) penampilan distribusi yang terlihat sangat dekat dengan Gaussian. Contoh tandingan akan disambut baik, tetapi ketika saya mencoba kasus lain yang awalnya tampak non-Gaussian, semakin meningkat tampaknya membawa distribusi kembali ke hasil tipe CLT.

X_{i}

$X_i$

n

$n$

n

$n$

Henry

Sebuah akibat wajar dari ini adalah akar-mean-kuadrat (atau kuadrat rata-rata) dari variabel acak iid sesuai skala (dikalikan dengan seperti dengan rata-rata aritmatika) juga menyatu dengan distribusi Gaussian asalkan momen ke- dari distribusi yang mendasarinya terbatas.

\sqrt{n}

$\sqrt{n}$

4

$4$

Henry

Hanya komentar singkat: klaim adalah kasus khusus dari metode Delta, lihat Teorema 5.5.24 dalam buku "Statistik inferensi" oleh Casella & Berger.

Michael M

@Michael: Mungkin Anda melihat sesuatu yang bukan saya saat ini, tetapi saya tidak berpikir masalah khusus ini sesuai dengan asumsi metode Delta klasik (misalnya, sebagaimana dinyatakan dalam teorema yang Anda referensi). Perhatikan bahwa tidak konvergen dalam distribusi (nontrivial pada ) dan karenanya "menerapkan metode Delta dengan " tidak memenuhi persyaratan yang dipersyaratkan. Namun, seperti yang ditunjukkan oleh jawaban S. Catterall, ini memberikan heuristik yang berguna yang mengarah pada jawaban yang benar.

Y

$Y$

R

$\mathbb R$

g (y) = \sqrt{| y |}

$g(y) = \sqrt{|y|}$

kardinal

(Saya percaya Anda dapat mengadaptasi bukti metode Delta ke kasus yang mirip dengan di atas untuk membuat sepenuhnya heuristik yang disebutkan di atas.)

kardinal

Jawaban:

Konvergensi ke Gaussian memang fenomena umum.

Misalkan adalah variabel acak IID dengan mean dan varians , dan tentukan jumlah . Perbaiki angka . Teorema Limit Pusat biasa memberi tahu kita bahwa sebagai , di mana adalah cdf normal standar. Namun, kesinambungan cdf pembatas menyiratkan bahwa kami juga memiliki $X_1,X_2,X_3,...$ $\mu\gt 0$ $\sigma^2$ $Y_n=\sum_{i=1}^n X_i$ $\alpha$ $P(\frac{Y_n-n\mu}{\sigma\sqrt n}\leq \alpha)\to\Phi(\alpha)$ $n\to\infty$ $\Phi$

P (\frac{Y_{n} - n μ}{σ \sqrt{n}} \leq α + \frac{α^{2} σ^{2}}{4 μ σ \sqrt{n}}) \to Φ (α)

$P\Big(\frac{Y_n-n\mu}{\sigma\sqrt n}\leq \alpha+\frac{\alpha^2 \sigma^2}{4\mu\sigma\sqrt n}\Big)\to\Phi(\alpha)$ karena istilah tambahan di sisi kanan ketidaksetaraan cenderung nol. Menyusun ulang ungkapan ini mengarah ke

P (Y_{n} \leq (\frac{α σ}{2 \sqrt{μ}} + \sqrt{n μ})^{2}) \to Φ (α)

$P\Big(Y_n\leq (\frac{\alpha\sigma}{2\sqrt \mu}+\sqrt{n\mu})^2\Big)\to\Phi(\alpha)$

Mengambil akar kuadrat, dan mencatat bahwa menyiratkan bahwa , kita memperoleh Dengan kata lain, . Hasil ini menunjukkan konvergensi ke Gaussian dalam batas sebagai . $\mu\gt 0$ $P(Y_n\lt 0)\to 0$

P (\sqrt{| Y_{n} |} \leq \frac{α σ}{2 \sqrt{μ}} + \sqrt{n μ}) \to Φ (α)

$P\Big(\sqrt{|Y_n|}\leq \frac{\alpha\sigma}{2\sqrt \mu}+\sqrt{n\mu}\Big)\to\Phi(\alpha)$

\frac{\sqrt{| Y_{n} |} - \sqrt{n μ}}{σ / 2 \sqrt{μ}} \overset{d}{\to} N (0, 1)

$\frac{\sqrt{|Y_n|}-\sqrt{n\mu}}{\sigma/{2\sqrt\mu}}\xrightarrow{d}N(0,1)$

n \to \infty

$n\to\infty$

Apakah ini berarti bahwa adalah perkiraan yang baik untuk untuk besar ? Ya, kita bisa melakukan yang lebih baik dari ini. Seperti yang dicatat oleh @Henry, dengan asumsi semuanya positif, kita dapat menggunakan , bersama dengan dan aproksimasi , untuk mendapatkan perkiraan aproksimasi seperti yang dinyatakan dalam pertanyaan di atas. Perhatikan juga bahwa kita masih memiliki karena $\sqrt{n\mu}$ $E[\sqrt{|Y_n|}]$ $n$ $E[\sqrt{Y_n}]=\sqrt{E[Y_n]-\text{Var}(\sqrt{Y_n})}$ $E[Y_n]=n\mu$ $\text{Var}(\sqrt{Y_n})\approx \frac{\sigma^2}{4\mu}$ $E[\sqrt{|Y_n|}]\approx\sqrt{n\mu- \dfrac{\sigma^2}{4\mu}}$

\frac{\sqrt{| Y_{n} |} - \sqrt{n μ - \frac{σ^{2}}{4 μ}}}{σ / 2 \sqrt{μ}} \overset{d}{\to} N (0, 1)

$\frac{\sqrt{|Y_n|}-\sqrt{n\mu-\frac{\sigma^2}{4\mu}}}{\sigma/{2\sqrt\mu}}\xrightarrow{d}N(0,1)$

\sqrt{n μ - \frac{σ^{2}}{4 μ}} - \sqrt{n μ} \to 0

$\sqrt{n\mu-\frac{\sigma^2}{4\mu}}-\sqrt{n\mu}\to 0$ sebagai .

n \to \infty

$n\to\infty$

S. Catterall Reinstate Monica
sumber

Anda mungkin perlu menambahkan sebagai untuk mendapatkan hasil saya

\sqrt{n μ} - \sqrt{n μ - \frac{σ^{2}}{4 μ}} \to 0

$\sqrt{n \mu}-\sqrt{n \mu-\tfrac{\sigma^2}{4\mu}} \to 0$

n \to \infty

${n \to \infty}$

Henry

@Henry Anda dapat mengganti dengan untuk konstanta dan ini tidak akan mengubah distribusi pembatas, tetapi ini dapat mengubah derajat adalah perkiraan yang baik untuk untuk besar yang spesifik . Bagaimana Anda menghasilkan ?

\sqrt{n μ}

$\sqrt{n\mu}$

\sqrt{n μ - k}

$\sqrt{n\mu-k}$

k

$k$

\frac{\sqrt{| Y_{n} |} - \sqrt{n μ - k}}{σ / 2 \sqrt{μ}}

$\frac{\sqrt{|Y_n|}-\sqrt{n\mu-k}}{\sigma/{2\sqrt\mu}}$

N (0, 1)

$N(0,1)$

n

$n$

\sqrt{n μ - \frac{σ^{2}}{4 μ}}

$\sqrt{n \mu-\tfrac{\sigma^2}{4\mu}}$

S. Catterall Reinstate Monica

Kami memiliki jadi . Dengan asumsi semuanya positif, sedangkan penyebut menyarankan , dan menggabungkan lead ini ke .

Var (Z) = E [Z^{2}] - (E [Z])^{2}

$\text{Var}(Z)=E[Z^2]-(E[Z])^2$

E [Z] = \sqrt{E [Z^{2}] - Var (Z)}

$E[Z]=\sqrt{E[Z^2]-\text{Var}(Z)}$

E [Z^{2}] = E [Y] = n μ

$E[Z^2]=E[Y]=n\mu$

\frac{\sqrt{| Y_{n} |} - \sqrt{n μ}}{σ / 2 \sqrt{μ}}

$\frac{\sqrt{|Y_n|}-\sqrt{n\mu}}{\sigma/{2\sqrt\mu}}$

Var (Z) \approx \frac{σ^{2}}{4 μ}

$\text{Var}(Z) \approx \dfrac{\sigma^2}{4\mu}$

E [Z] \approx \sqrt{n μ - \frac{σ^{2}}{4 μ}}

$E[Z] \approx \sqrt{n\mu- \dfrac{\sigma^2}{4\mu}}$

Henry

Ok, terima kasih, saya sudah mencoba membahas ini dalam jawaban saya sekarang.

S. Catterall Reinstate Monica