Jadi kita tahu bahwa jumlah poissons dengan parameter sendiri merupakan poisson dengan . Jadi hipotetis, salah satu bisa mengambil dan mengatakan itu sebenarnya di mana setiap adalah: , dan mengambil n besar untuk mendapatkan CLT bekerja.
Ini (jelas) tidak berhasil. Saya berasumsi ini ada hubungannya dengan bagaimana CLT bekerja "lebih cepat" untuk variabel acak yang "lebih dekat" ke normal, dan bahwa semakin kecil lambda, semakin kita mendapatkan variabel acak yang sebagian besar 0 dan jarang bervariasi hal lain.
Namun, apa yang saya jelaskan adalah intuisi saya. Apakah ada cara yang lebih formal untuk menjelaskan mengapa demikian?
Terima kasih!
Jawaban:
Saya setuju dengan @whuber bahwa akar kebingungan tampaknya menggantikan asimptotik penjumlahan di CLT dengan semacam divisi dalam argumen Anda. Dalam CLT kita mendapatkan distribusi tetap kemudian menarik n angka x i dari itu dan menghitung jumlah ˉ x n = 1f(x,λ) n xi . Jika kita terus meningkatnmaka hal yang menarik terjadi:
√x¯n=1n∑ni=1xi n
manaμ,σ2adalah rata-rata dan varian dari distribusif(x).
Apa yang Anda menyarankan untuk dilakukan dengan Poisson agak mundur: bukan menjumlahkan variabel dari tetap distribusi, Anda ingin membagi dengan tetap distribusi ke pernah berubah bagian. Dengan kata lain Anda mengambil variabel dari tetap distribusi f ( x , λ ) kemudian membagi menjadi x i sehingga n Σ i = 1 x i ≡ xx f(x,λ) xi
Apa yang dikatakan CLT tentang proses ini? Tidak ada. Perhatikan, bagaimana di CLT kita pernah berubah , dandistribusinya yangberubahfn(x)yang menyatu dengandistribusitetapN(0,σ2)n−−√(x¯n−μ) fn(x) N(0,σ2)
Dalam pengaturan Anda, baik jumlah maupun distribusinya f ( x , λ )x f(x,λ) tidak berubah! Mereka sudah diperbaiki. Mereka tidak berubah, mereka tidak bertemu dengan apa pun. Jadi, CLT tidak mengatakan apa-apa tentang mereka.
Juga, CLT tidak mengatakan apa-apa tentang jumlah elemen dalam penjumlahan. Anda dapat memiliki jumlah 1000 variabel dari Poisson (0,001) dan CLT tidak akan mengatakan apa-apa tentang jumlah tersebut. Yang dikatakannya adalah bahwa jika Anda terus meningkatkan N maka pada titik tertentu jumlah ini akan mulai terlihat seperti distribusi normal . Bahkan jika N = 1.000.000 Anda akan mendapatkan perkiraan dekat dari distribusi normal.1N∑Ni=1xi,xi∼Poisson(0.001)
Intuisi Anda benar hanya tentang jumlah elemen dalam penjumlahan, yaitu daripada lebih banyak distribusi awal berbeda dari normal, maka lebih banyak elemen yang Anda perlu menjumlahkan untuk mendapatkan normal. Lebih formal (tapi masih informal) cara akan dengan melihat fungsi karakteristik Poisson: Jika Anda λ > > 1 , yang Anda dapatkan dengan ekspansi Taylor (wrt t ) dari eksponen bersarang: ≈ exp ( i λ t - λ / 2 t )
Namun, intuisi Anda tidak diterapkan dengan benar: Anda memindahkan penjumlahan di CLT dengan beberapa jenis mengacaukan segalanya, dan menjadikan CLT tidak dapat diterapkan.
sumber
Masalah dengan contoh Anda adalah bahwa Anda membiarkan parameter berubah saat berubah. CLT memberi tahu Anda bahwa untuk distribusi tetap dengan mean dan sd terbatas, seperti n → ∞n n→∞ ,
di mana dan σ berasal dari mean dan sd dari distribusi x .μ σ x
EDIT
While the CLT does not readily apply to sums, the approximation based on the CLT certainly does. I believe this is what the OP was referring to when discussing applying the CLT to the sum.
sumber
The question is, I argue, more interesting if thought about more generally, letting the distribution of the parent Poisson depend onn , say with parameter λn and λn=1 as a special case. I think it's perfectly reasonable to ask why, and how we can understand that, a central limit theorem does not hold for the sum Sn=∑ni=1Xi,n . After all, it's common to apply a CLT even in problems where the distributions of the components of the sum depend on n . It's also common to decompose Poisson distributions as the distribution of a sum of Poisson variables, and then apply a CLT.
The key issue as I see it is that your construction implies the distribution ofXi,n depends on n in such a way that the parameter of the distribution of Sn does not grow in n . If you would instead have taken, for example, Sn∼Poi(n) and made the same decomposition, the standard CLT would apply. In fact, one can think of many decompositions of a Poi(λn) distribution that allows for application of a CLT.
The Lindeberg-Feller Central Limit Theorem for triangular arrays is often used to examine convergence of such sums. As you point out,Sn∼Poi(1) for all n , so Sn cannot be asymptotically normal. Still, examining the Lindeberg-Feller condition sheds some light on when decomposing a Poisson into a sum may lead to progress.
A version of the theorem may be found in these notes by Hunter. Lets2n=Var(Sn) . The Lindeberg-Feller condition is that, ∀ϵ>0 :
Now, for the case at hand, the variance of the terms in the sum is dying off so quickly inn that sn=1 for every n . For fixed n , we also have that the Xi,n are iid. Thus, the condition is equivalent to
But, for smallϵ and large n ,
which does not approach zero. Thus, the condition fails to hold. Again, this is as expected since we already know the exact distribution ofSn for every n , but going through these calculations gives some indications of why it fails: if the variance didn't die off as quickly in n you could have the condition hold.
sumber