Saya memiliki sampel acak variabel acak Bernoulli , di mana adalah iidrv dan , dan adalah parameter yang tidak diketahui.
Jelas, satu dapat menemukan perkiraan untuk : .
Pertanyaan saya adalah bagaimana saya bisa membangun interval kepercayaan untuk ?
confidence-interval
binomial
bernoulli-distribution
amuba kata Reinstate Monica
sumber
sumber
Jawaban:
Jika rata-rata, , tidak dekat atau , dan ukuran sampel cukup besar (yaitu dan , kepercayaan Interval dapat diperkirakan dengan distribusi normal dan interval kepercayaan dibangun sebagai berikut:p^ 1 0 n np^>5 n(1−p^)>5
Jika dan , interval kepercayaan kira-kira (Javanovic dan Levy, 1997) ; kebalikannya berlaku untuk . Referensi juga membahas penggunaan menggunakan dan (yang kemudian memasukkan informasi sebelumnya).p^=0 n>30 95% [0,3n] p^=1 n+1 n+b
Lain Wikipedia memberikan gambaran yang baik dan poin untuk Agresti dan Couli (1998) dan Ross (2003) untuk rincian tentang estimasi selain pendekatan normal, skor Wilson, Clopper-Pearson, atau Agresti-Coull interval. Ini bisa lebih akurat ketika asumsi di atas tentang dan tidak terpenuhi.n p^
R menyediakan fungsi
binconf {Hmisc}
danbinom.confint {binom}
yang dapat digunakan dengan cara berikut:Agresti, Alan; Coull, Brent A. (1998). "Perkiraan lebih baik daripada 'tepat' untuk estimasi interval proporsi binomial". Ahli Statistik Amerika 52: 119-126.
Jovanovic, BD dan PS Levy, 1997. A Look at Rule of Three. The American Statistician Vol. 51, No. 2, hlm. 137-139
Ross, TD (2003). "Interval kepercayaan yang akurat untuk proporsi binomial dan estimasi tingkat Poisson". Komputer dalam Biologi dan Kedokteran 33: 509-531.
sumber
Interval kepercayaan kemungkinan maksimum
Perkiraan normal untuk sampel Bernoulli bergantung pada memiliki ukuran sampel yang relatif besar dan proporsi sampel yang jauh dari ekor. Estimasi kemungkinan maksimum berfokus pada peluang log-transformed dan ini memberikan interval non-simetris, efisien untuk yang seharusnya digunakan.p
Definisikan log-odds sebagaiβ^0=log(p^/(1−p^))
1- CI untuk diberikan oleh:α β0
Dan ini kembali diubah menjadi interval (non-simetris) untuk dengan:p
CI ini memiliki manfaat tambahan bahwa proporsi terletak pada interval antara 0 atau 1, dan CI selalu lebih sempit daripada interval normal sambil berada pada level yang benar. Anda bisa mendapatkan ini dengan sangat mudah di R dengan menetapkan:
Interval kepercayaan binomial yang tepat
Dalam sampel kecil, perkiraan normal untuk MLE - sementara lebih baik daripada perkiraan normal untuk proporsi sampel - mungkin tidak dapat diandalkan. Tidak apa-apa. dapat diambil untuk mengikuti kepadatan binomial . Batas untuk dapat ditemukan dengan mengambil persentil ke 2.5 dan 97.5 dari distribusi ini.Y=np^ (n,p) p^
Jarang mungkin dilakukan dengan tangan, interval kepercayaan binomial yang tepat dapat diperoleh untuk menggunakan metode komputasi.p
Interval kepercayaan bias rata-rata
Dan jika adalah 0 atau 1 tepat, penaksir rata-rata median dapat digunakan untuk mendapatkan estimasi interval non-singular berdasarkan fungsi probabilitas rata-rata tidak bias. Anda dapat dengan mudah mengambil batas bawah dari case all-0 sebagai 0 WLOG. Batas atas adalah proporsi yang memenuhi:p p1−α/2
Ini juga merupakan rutinitas komputasi.
Dua metode terakhir diimplementasikan dalam
epitools
paket di R.sumber