Memahami uji Chi-squared dan distribusi Chi-squared

13

Saya mencoba memahami logika di balik uji chi-squared.

Tes Chi-squared adalah . kemudian dibandingkan dengan distribusi Chi-kuadrat untuk mengetahui nilai p.untuk menolak atau tidak hipotesis nol. : pengamatan berasal dari distribusi yang kami gunakan untuk menciptakan nilai yang kami harapkan. Sebagai contoh, kita bisa menguji apakah probabilitas untuk mendapatkan diberikan oleh seperti yang kita harapkan. Jadi kami membalik 100 kali dan menemukan dan . Kami ingin membandingkan temuan kami dengan apa yang diharapkan ( ). Kita juga bisa menggunakan distribusi binomial tetapi itu bukan inti dari pertanyaan ... Pertanyaannya adalah: χ2H0pnH1-nH100pχ2=(obsexp)2expχ2H0headpnH Heads1nH tails100p

Bisakah Anda jelaskan mengapa, di bawah hipotesis nol, mengikuti distribusi chi-squared?(obsexp)2exp

Yang saya tahu tentang distribusi Chi-square adalah bahwa distribusi chi-square dari derajat adalah jumlah dari distribusi normal standar kuadrat.kkk

Remi.b
sumber
2
Tidak: ini hanya perkiraan. (Banyak) lebih banyak tentang ini muncul di utas di stats.stackexchange.com/questions/16921/… .
whuber
Ini mungkin membuktikan minat Karl Pearson dan Tes Chi-squared, (Placket, 1983) {pdf}
Avraham
Sebuah pertanyaan yang terkait tentang mengapa distribusi chi-kuadrat digunakan untuk kebaikan tes fit, meskipun tidak cukup duplikat: stats.stackexchange.com/questions/125312/...
Silverfish

Jawaban:

12

Kita juga bisa menggunakan distribusi binomial tetapi itu bukan inti dari pertanyaan ...

Namun demikian, ini adalah titik awal kami bahkan untuk pertanyaan Anda yang sebenarnya. Saya akan membahasnya secara informal.

Mari kita pertimbangkan dengan kasus binomial secara lebih umum:

YBin(n,p)

Asumsikan dan sedemikian rupa sehingga didekati dengan baik oleh normal dengan mean dan varians yang sama (beberapa persyaratan tipikal adalah tidak kecil, atau bahwa tidak kecil).p Y mnt ( n p , n ( 1 - p ) )npYmin(np,n(1p))np(1p)

Maka kira-kira . Di sini adalah jumlah keberhasilan.χ 2 1 Y(YE(Y))2/Var(Y)χ12Y

Kami memiliki dan .Var ( Y ) = n p ( 1 - p )E(Y)=npVar(Y)=np(1p)

(Dalam kasus pengujian, dikenal dan ditentukan dalam . Kami tidak melakukan estimasi.)p H 0npH0

Jadi kira-kira .χ 2 1(Ynp)2/np(1p)χ12

Perhatikan bahwa . Perhatikan juga bahwa .1(Ynp)2=[(nY)n(1p)]21p+11p=1p(1p)

Karenanya(Ynp)2np(1p)=(Ynp)2np+(Ynp)2n(1p)=(Ynp)2np+[(nY)n(1p)]2n(1p)=(OSES)2ES+(OFEF)2EF

Yang hanya statistik chi-square untuk kasus binomial.

Jadi dalam hal ini statistik chi-square harus memiliki distribusi kuadrat dari variabel acak standar (normal).

Glen_b -Reinstate Monica
sumber