Clopper-Pearson untuk non matematikawan

12

Saya bertanya-tanya apakah ada yang bisa menjelaskan kepada saya intuisi di luar Clopper-Pearson CI untuk proporsi.

Sejauh yang saya tahu, setiap CI menyertakan varian di dalamnya. Namun, untuk proporsi, bahkan jika proporsi saya adalah 0 atau 1 (0% atau 100%), Clopper-Pearson CI dapat dihitung. Saya mencoba melihat formula, dan saya mengerti ada sesuatu dengan persentil dari distribusi Binomial dan saya mengerti bahwa menemukan CI melibatkan iterasi, tapi saya bertanya-tanya apakah ada yang bisa menjelaskan logika dan rasional dalam "kata-kata sederhana", atau dengan matematika minimum ?

pengguna40850
sumber

Jawaban:

22

Ketika Anda mengatakan bahwa Anda terbiasa dengan interval kepercayaan yang mengandung ekspresi untuk varian, Anda memikirkan kasus Gaussian, di mana informasi tentang dua parameter yang mencirikan populasi — satu mean & yang lain variansnya — dirangkum oleh sampel mean & varians sampel. Rata-rata sampel memperkirakan rata-rata populasi, tetapi presisi yang digunakan tergantung pada varians populasi, yang pada gilirannya diperkirakan oleh varians sampel. Distribusi binomial, di sisi lain, hanya memiliki satu parameter — probabilitas keberhasilan pada setiap uji coba individu — & semua informasi yang diberikan oleh sampel tentang parameter ini dirangkum dalam jumlah total. sukses dari begitu banyak percobaan independen. Varians populasi dan mean keduanya ditentukan oleh parameter ini.

πxn

Pr(X=x)=(nx)πx(1π)nx

Tingkatkan hingga probabilitas atau lebih sedikit keberhasilan turun menjadi 2,5%: itulah batas Anda. Turunkan hingga probabilitas atau lebih banyak keberhasilan turun menjadi 2,5%: itulah batas bawah Anda. (Saya sarankan Anda benar-benar mencoba melakukan ini jika tidak jelas dari membacanya.) Apa yang Anda lakukan di sini adalah menemukan nilai bahwa ketika diambil sebagai hipotesis nol akan menyebabkan (hanya saja) ditolak oleh uji dua sisi pada tingkat signifikansi 5%. Dalam jangka panjang, batas yang dihitung dengan cara ini mencakup nilai sebenarnya dari , apa pun itu, setidaknya 95% dari waktu.πxπxππ

Scortchi - Reinstate Monica
sumber
+1. Ini mungkin pantas mendapatkan pertanyaan sendiri, tetapi saya akan segera bertanya di sini: untuk aplikasi tertentu saya ingin mendapatkan ukuran ketidakpastian tunggal (sesuatu yang berperilaku seperti kesalahan standar rata-rata) untuk berbagai proporsi. Saya tahu bahwa ada sejumlah prosedur CI binomial, termasuk Clopper-Pearson. Apakah masuk akal untuk mengambil lebar CI seperti itu sebagai ukuran ketidakpastian? Atau mungkin lebar / 1,96 / 2 untuk membuatnya menghasilkan SEM tepat dalam batas Gaussian.
Amoeba mengatakan Reinstate Monica
1
@amoeba: Agaknya Anda berpikir tentang ukuran sampel kecil: (1) Anda mungkin menginginkan sesuatu seperti Blaker-Spjotvoll CIs daripada CI berdasarkan uji area yang sama. (2) Distribusi kepercayaan agak berombak, yang akan membuat lebar setiap interval yang diberikan tidak sensitif terhadap cakupan yang Anda tentukan.
Scortchi