Dua Sampel uji chi kuadrat

10

Pertanyaan ini dari buku Asymptotic Statistics Van der Vaart, hal. 253. # 3:

Misalkan Xm dan Yn adalah vektor multinomial independen dengan parameter (m,Sebuah1,...,Sebuahk) dan (n,b1,...,bk) . Di bawah hipotesis nol bahwa Sebuahsaya=bsaya menunjukkan bahwa

saya=1k(Xm,saya-mc^saya)2mc^saya+saya=1k(Yn,saya-nc^saya)2nc^saya
memilikiχk-12 distribusi. di mana c i=(Xm,i+Yn,i)/(m+n).c^saya=(Xm,saya+Yn,saya)/(m+n)

Saya butuh bantuan untuk memulai. Apa strateginya di sini? Saya bisa menggabungkan dua puncak menjadi:

i=1k(mYn,inXm,i)2mn(m+n)c^i

tetapi ini tidak akan bekerja dengan CLT karena kombinasi tertimbang dari Xm dan Yn . Tidak yakin apakah ini jalan yang benar. Ada saran?

EDIT: jika m=n maka itu cukup mudah karena kita dapatkan

mYnnXmmn(m+n)=YnXm(m+n)

di mana pembilang dapat dilihat sebagai jumlah dari perbedaan Multinomial variabel sehingga kita dapat menerapkan CLT dan kemudian menyelesaikannya dengan Teorema 17.2 dari pasal yang sama. Namun, saya tidak tahu bagaimana menyelesaikannya dalam situasi ini dengan ukuran sampel yang berbeda. Ada bantuan?(1,a1,,ak)

Tautan ke van der Vaart bab 17 dari Google Books

bdeonovic
sumber

Jawaban:

6

Pertama beberapa notasi. Mari dan { Y t } 1 , ... , n menunjukkan urutan kategoris terkait dengan X m dan Y n , yaitu Pr { X t = i } = a i , Pr { Y t = i } = b i . Misalkan N = n + m{Xt}1,,m{Yt}1,,nXmYnPr{Xt=i}=ai,Pr{Yt=i}=biN=n+m. Pertimbangkan binerisasi manaδi,j1i=jadalah Kronecker Delta. Jadi kita memilikiXm,i= N Σ t =

Xi=(X1,i,,XN,i)=(δi,X1,,δi,Xn,0,,0)Yi=(Y1,i,,YN,i)=(0,,0,δi,Y1,,δi,Yn)
δi,j1i=j
Xm,i=t=1NXt,i=t=1mδi,XtYn,i=t=1NYt,i=t=1nδi,Yt

Sekarang kita mulai buktinya. Pertama kita menggabungkan dua puncak statistik uji. Perhatikan bahwa Jadi kita dapat menulis statistik uji sebagaiS

Xm,imc^i=(n+m)Xm,im(Xm,i+Yn,i)n+m=nXm,imYn,in+mYn,inc^i=(n+m)Yn,in(Xm,i+Yn,i)n+m=mYn,inXm,in+m
S=saya=1k(Xm,saya-mc^saya)2mc^saya+saya=1k(Yn,saya-nc^saya)2nc^saya=saya=1k(nXm,saya-mYn,saya)2(n+m)2mc^saya+saya=1k(nXm,saya-mYn,saya)2(n+m)2nc^saya=saya=1k(nXm,saya-mYn,saya)2nm(n+m)c^saya

Catatan berikutnya yang dengan sifat sebagai berikut E [ Z i ]

nXm,saya-mYn,saya=t=1NnXt,saya-mYt,saya=Zsaya
E[Zsaya]=nE[Xm,saya]-mE[Yn,saya]=nmSebuahsaya-nmSebuahsaya=0Var[Zsaya]=Var[nXm,saya-mYn,saya]=n2Var[Xm,saya]-m2Var[Yn,saya]Catatan Xm,saya dan Yn,saya independen=n2mSebuahsaya(1-Sebuahsaya)+m2nSebuahsaya(1-Sebuahsaya)=nm(n+m)Sebuahsaya(1-Sebuahsaya)Cov[Zsaya,Zj]=E[ZsayaZj]-E[Zsaya]E[Zj]=E[(nXm,saya-mYn,saya)(nXm,j-mYn,j)]=n2(-mSebuahsayaSebuahj+m2SebuahsayaSebuahj)-2n2m2SebuahsayaSebuahj+m2(-nSebuahsayaSebuahj+n2SebuahsayaSebuahj)=-nm(n+m)SebuahsayaSebuahj

1nm(n+m)Z=nXm-mYnnm(n+m)DN(0,Σ)
(saya,j)Σσsayaj=Sebuahsaya(δsayaj-Sebuahj)c^=(c^1,...,c^k)hal(Sebuah1,...,Sebuahk)=Sebuah
nXm-mYnnm(n+m)c^DN(0,sayak-SebuahSebuah)
sayakk×kSebuah=(Sebuah1,...,Sebuahk)sayak-SebuahSebuahk-1
saya=1k(nXm,saya-mYn,saya)2nm(n+m)c^sayaDχk-12
bdeonovic
sumber