Apa teknik terbaik untuk menghitung interval kepercayaan dari percobaan binomial, jika perkiraan Anda adalah (atau sama dengan ) dan ukuran sampel relatif kecil, misalnya ?p = 1 n = 25
confidence-interval
binomial
Kasper
sumber
sumber
scipy.stats.beta.ppf(1−$\alpha$;x+1,n−x)
scipy.stats.beta.ppf(1−$\alpha$;x+1,n−x)
Jawaban:
Jangan gunakan perkiraan normal
Banyak yang telah ditulis tentang masalah ini. Saran umum adalah jangan pernah menggunakan perkiraan normal (mis., Interval kepercayaan asimptotik / Wald), karena memiliki sifat cakupan yang mengerikan. Kode R untuk menggambarkan ini:
Untuk probabilitas keberhasilan yang kecil, Anda mungkin meminta interval kepercayaan 95%, tetapi sebenarnya mendapatkan, katakanlah, interval kepercayaan 10%!
Rekomendasi
Jadi apa yang harus kita gunakan? Saya percaya rekomendasi saat ini adalah yang tercantum dalam makalah Estimasi Interval untuk Proporsi Binomial oleh Brown, Cai dan DasGupta dalam Ilmu Statistik 2001, vol. 16, tidak. 2, halaman 101–133. Para penulis memeriksa beberapa metode untuk menghitung interval kepercayaan, dan sampai pada kesimpulan berikut.
Interval Wilson juga kadang-kadang disebut interval skor , karena didasarkan pada pembalikan tes skor.
Menghitung intervalnya
Untuk menghitung interval kepercayaan ini, Anda dapat menggunakan kalkulator online ini atau
binom.confint()
fungsi dalambinom
paket di R. Misalnya, untuk 0 keberhasilan dalam 25 percobaan, kode R adalah:Ini
bayes
adalah interval Jeffrey. (Argumentype="central"
diperlukan untuk mendapatkan interval sama-ekor .)Perhatikan bahwa Anda harus memutuskan yang mana dari tiga metode yang ingin Anda gunakan sebelum menghitung interval. Melihat ketiganya dan memilih yang terpendek secara alami akan memberi Anda kemungkinan cakupan yang terlalu kecil.
Jawaban cepat dan perkiraan
Sebagai catatan akhir, jika Anda mengamati persis nol keberhasilan dalam Anda n cobaan dan hanya ingin interval kepercayaan sangat cepat perkiraan, Anda dapat menggunakan aturan tiga . Cukup bagi angka 3 dengan n . Dalam contoh di atas n adalah 25, jadi batas atas adalah 3/25 = 0,12 (batas bawah tentu saja 0).
sumber
bayes
menggunakan seragam sebelumnya (bukan Jeffrey) ketika kedua parameter bentuk adalah 1. Saya diemail dengan pengelola paket binom karena penasaran tentang (perbedaan) keuntungan Jeff seragam vs seragam sebelumnya dan dia mengatakan kepada saya bahwa versi baru akan menggunakan seragam sebelumnya sebagai standar. Jadi jangan heran jika hasilnya sedikit berbeda di masa depan.binconf
metode dalamHmisc
juga menghitung interval ini. Ini default ke metode Wilson.sumber