Distribusi sampel dari dua populasi Bernoulli independen

17

Mari kita asumsikan bahwa kita memiliki sampel dua variabel acak Bernoulli independen, dan .B e r ( θ 2 )Ber(θ1)Ber(θ2)

Bagaimana kami membuktikan bahwa ?

(X¯1X¯2)(θ1θ2)θ1(1θ1)n1+θ2(1θ2)n2dN(0,1)

Asumsikan .n1n2

Seorang lelaki tua di laut.
sumber
Z_i = X_1i - X_2i adalah suatu urutan iid rv dari mean dan varian terbatas. Oleh karena itu memenuhi teorema batas pusat Levy-Linderberg dari mana hasil Anda ikuti. Atau apakah Anda meminta bukti dari clt itu sendiri?
Three Diag
@ThreeDiag Bagaimana Anda menerapkan versi LL dari CLT? Saya pikir itu tidak benar. Tulis jawaban untuk saya untuk memeriksa detailnya.
Seorang pria tua di laut.
Semua detail sudah ada di sana. Agar LL dapat diterapkan, Anda perlu urutan iid rv dengan mean dan varian terbatas. Variabel Z_i = X_i1 dan X_i2 memenuhi ketiga persyaratan. Kemandirian mengikuti dari kemandirian dari dua bernoulli vars asli dan Anda dapat melihat bahwa E (Z_i) dan V (Z_i) terbatas dengan menerapkan properti standar E dan V
Three Diag
1
"sampel dua variabel acak Bernoulli independen" - ekspresi yang salah. Harus: "dua sampel independen dari distribusi Bernoulli".
Viktor
1
Harap tambahkan "as n1,n2 ".
Viktor

Jawaban:

10

Letakkan , , , . Kami memiliki . Dalam hal fungsi karakteristik itu berarti Kami ingin membuktikan bahwa b=a=θ1(1θ1)n1b=θ2(1θ2)n2B = ( ˉ X 2 - θ 2 ) / b A d N ( 0 , 1 ) , B d N ( 0 , 1 ) ϕ A ( t ) E e i t Ae - t 2 / 2A=(X¯1θ1)/aB=(X¯2θ2)/bAdN(0,1), BdN(0,1)D : = a

ϕA(t)EeitAet2/2, ϕB(t)et2/2.
D:=aa2+b2Aba2+b2BdN(0,1)

Karena dan bersifat independen, seperti yang kita inginkan.B ϕ D ( t ) = ϕ A ( aAB

ϕD(t)=ϕA(aa2+b2t)ϕB(ba2+b2t)et2/2,

Bukti ini tidak lengkap. Di sini kita perlu beberapa perkiraan untuk konvergensi fungsi karakteristik yang seragam. Namun dalam kasus yang dipertimbangkan kita dapat melakukan perhitungan eksplisit. Letakkan . sebagai . Jadi, untuk tetap , ϕ X 1 , 1 ( t )p=θ1, m=n1t3m-3/20tφD(t)=(1-a2t2

ϕX1,1(t)=1+p(eit1),ϕX¯1(t)=(1+p(eit/m1))m,ϕX¯1θ1(t)=(1+p(eit/m1))meipt,ϕA(t)=(1+p(eit/mp(1p)1))meiptm/p(1p)=((1+p(eit/mp(1p)1))eipt/mp(1p))m=(1t22m+O(t3m3/2))m
t3m3/20t
ϕD(t)=(1a2t22(a2+b2)n1+O(n13/2))n1(1b2t22(a2+b2)n2+O(n23/2))n2et2/2
(bahkan jika atau ), sejak ketika (lihat /math/2566469/uniform-bounds-for-1-y-nn-exp-y/ ).a0b0|ey(1y/m)m|y2/2m  y/m<1/2

Perhatikan bahwa perhitungan serupa dapat dilakukan untuk distribusi sewenang-wenang (tidak harus Bernoulli) dengan momen kedua terbatas, menggunakan perluasan fungsi karakteristik dalam hal dua momen pertama.

Viktor
sumber
Ini sepertinya benar. Saya akan menghubungi Anda lagi nanti, ketika saya punya waktu untuk memeriksa semuanya. ;)
Seorang lelaki tua di laut.
-1

Membuktikan pernyataan Anda setara dengan membuktikan (Levy-Lindenberg) Central Limit Theorem yang menyatakan

Jika adalah urutan variabel acak iid dengan mean hingga dan varian terbatas lalu{Zi}i=1nE(Zi)=μV(Zi)=σ2

n(Z¯μ)dN(0,σ2)

Di sini yang merupakan varian sampel.Z¯=iZi/n

Maka mudah untuk melihat itu jika kita menempatkan

Zi=X1iX2i
dengan mengikuti dan masing-masing, kondisi untuk teorema tersebut terpenuhi, khususnyaX1i,X2iBer(θ1)Ber(θ2)

E(Zi)=θ1θ2=μ

dan

V(Zi)=θ1(1θ1)+θ2(1θ2)=σ2

(Ada bagian terakhir, dan Anda harus sedikit menyesuaikan ini untuk kasus umum di mana tapi saya harus pergi sekarang, akan selesai besok atau Anda dapat mengedit pertanyaan dengan bagian terakhir sebagai latihan)n1n2

Tiga Diag
sumber
Saya tidak dapat memperoleh apa yang sebenarnya saya inginkan karena kemungkinann1n2
Seorang lelaki tua di laut.
Saya akan tunjukkan nanti jika Anda tidak bisa mendapatkannya. Petunjuk: hitung varians dari mean sampel Z dan gunakan itu sebagai variabel dalam teorema
Three Diag
Tiga, bisakah Anda menambahkan detail kapan ? Terima kasihn1n2
Seorang lelaki tua di laut.
Akan lakukan segera setelah menemukan timr sedikit. Sebenarnya ada kehalusan yang mencegah menggunakan LL clt tanpa penyesuaian. Ada tiga cara untuk pergi, yang paling sederhana adalah memohon fakta bahwa untuk n1 dan n2 besar, X1 dan X2 masuk dalam distribusi ke normals, maka kombinasi linear normal juga normal. Ini adalah properti normals yang dapat Anda ambil sebagaimana diberikan, jika tidak, Anda dapat membuktikannya dengan fungsi karakteristik.
Three Diag
Dua lainnya memerlukan clt yang berbeda (mungkin Lyapunov) atau sebagai alternatif memperlakukan n1 = i dan n2 = i + k. Kemudian untuk i besar Anda pada dasarnya dapat mengabaikan k dan Anda dapat kembali menerapkan LL (tapi tetap saja akan membutuhkan perawatan untuk mengatasi varian yang tepat)
Three Diag