Ini adalah pertanyaan yang sangat mendasar. Mengapa kita menggunakan distribusi chi square? Apa arti dari distribusi ini? Mengapa ini distribusi yang digunakan untuk membuat interval kepercayaan untuk varians?
Setiap tempat saya mencari penjelasan hanya menyajikan fakta ini, menjelaskan kapan harus menggunakan chi, tetapi tidak menjelaskan mengapa menggunakan chi, dan mengapa itu terlihat seperti itu.
Banyak terima kasih kepada siapa pun yang dapat mengarahkan saya ke arah yang benar dan itu - benar-benar memahami mengapa saya menggunakan chi ketika saya membuat interval kepercayaan untuk varians.
variance
chi-squared
nafrtiti
sumber
sumber
Jawaban:
Jawaban cepat
Alasannya adalah karena, dengan asumsi data iid dan , dan mendefinisikan ˉ XXi∼N(μ,σ2)
saat membentuk interval kepercayaan, distribusi sampling yang terkait dengan varians sampel (S2, ingat, variabel acak!) Adalah distribusi chi-square (S2(N-1)/σ2∼χ2n-1), sama seperti distribusi sampling yang terkait dengan mean sampel adalah distribusi normal standar ((ˉX-μ)√
Jawaban panjang
Pertama-tama, kita akan membuktikan bahwa mengikuti distribusi chi-square dengan N - 1S2(N−1)/σ2 N−1 derajat kebebasan. Setelah itu, kita akan melihat bagaimana bukti ini berguna ketika menurunkan interval kepercayaan untuk varians, dan bagaimana distribusi chi-square muncul (dan mengapa itu sangat berguna!). Mari kita mulai.
Bukti
Untuk ini, mungkin Anda harus terbiasa dengan distribusi chi-square di artikel Wikipedia ini . Distribusi ini hanya memiliki satu parameter: derajat kebebasan, , dan kebetulan memiliki Moment Generating Function (MGF) yang diberikan oleh: m χ 2 ν ( t ) = ( 1 - 2 t ) - ν / 2 . Jika kita dapat menunjukkan bahwa distribusi S 2 ( N - 1 ) / σ 2 memiliki fungsi menghasilkan momen seperti ini, tetapi dengan ν =ν
Jika kita mendefinisikan,
IfY1 and Y2 are independent and each distribute as a chi-square distribution but with ν1 and ν2 degrees of freedom, then W=Y1+Y2 distributes with a chi-square distribution with ν1+ν2 degrees of freedom (this follows from taking the MGF of W ; do this!).
With the above facts, note that if you multiply the sample variance byN−1 , you obtain (after some algebra),
Calculating the Confidence Interval for the variance.
When looking for a confidence interval for the variance, you want to know the limitsL1 and L2 in
sumber