Latar Belakang dan Terminologi
Untuk memperjelas apa yang sedang kita diskusikan, mari kita buat beberapa konsep dan terminologi. Model yang bagus untuk proporsi adalah guci biner: berisi guci berwarna perak ("sukses") atau fuchsia ("gagal"). Proporsi bola perak di dalam guci adalah (tapi ini bukan "proporsi" yang akan kita bicarakan). p
Guci ini menyediakan cara untuk memodelkan Pengadilan Bernoulli . Untuk mendapatkan satu realisasi, campur bola dengan seksama dan tarik keluar secara buta, amati warnanya. Untuk mendapatkan realisasi tambahan, pertama-tama ganti kembali kotak dengan mengembalikan bola yang ditarik, kemudian ulangi prosedur beberapa kali yang telah ditentukan. Urutan realisasi dapat diringkas dengan hitungan keberhasilan nya, . Ini adalah variabel acak yang propertinya sepenuhnya ditentukan oleh dan . Distribusi disebut distribusi Binomial . Proporsi (percobaan, atau "sampel") adalah rasioX n p X ( n , p ) X / nnXnpX(n,p)X/n.
Angka-angka ini adalah barplot dari distribusi probabilitas untuk berbagai proporsi binomial . Yang paling penting adalah pola yang konsisten, terlepas dari , di mana distribusinya menjadi lebih sempit (dan bar semakin tinggi) seiring bergerak dari ke bawah.n p 1 / 2X/nnp1/2
Standar deviasi adalah standar kesalahan proporsi yang disebutkan dalam pertanyaan. Untuk setiap diberikan , jumlah ini hanya dapat bergantung pada . Sebut saja . Dengan mengalihkan peran bola - sebut yang perak "kegagalan" dan yang fuchsia "sukses" - mudah untuk melihat bahwa . Jadi situasi di mana --yaitu, 1/2 - harus menjadi istimewa. Pertanyaannya menyangkut bagaimana bervariasi ketika bergerak menjauh dari ke nilai yang lebih ekstrim, sepertin p se ( p ) se ( p ) = se ( 1 - p ) p = 1 - p p = 1 / 2 se ( p ) p 1 / 2 0X/nnpse(p)se(p)=se(1−p)p=1−pp=1/2se(p)p1/20.
Pengetahuan vs Pemahaman
Karena setiap orang telah diperlihatkan angka-angka seperti ini di awal pendidikan mereka, semua orang "tahu" lebar plot - yang diukur dengan harus berkurang ketika bergerak menjauh dari . Tetapi pengetahuan itu benar-benar hanya pengalaman, sedangkan pertanyaannya mencari pemahaman yang lebih dalam. Pemahaman semacam itu tersedia dari analisis yang cermat terhadap distribusi Binomial, seperti yang dilakukan Abraham de Moivre sekitar 300 tahun yang lalu. (Mereka serupa dengan mereka yang saya presentasikan dalam diskusi tentang Teorema Limit Sentral ). Namun, saya pikir bahwa beberapa pertimbangan yang relatif sederhana mungkin cukup untuk menyatakan bahwa lebar harus terluas dekat .se(p)p1/2p=1/2
Analisis Intuitif Sederhana
Jelas bahwa kita harus mengharapkan proporsi keberhasilan dalam percobaan mendekati . Kesalahan standar menyangkut seberapa jauh dari ekspektasi itu kita bisa beranggapan bahwa hasil aktual akan terletak. Seandainya, tanpa kehilangan keumuman, bahwa adalah antara dan , apa yang diperlukan untuk meningkatkan dari ? Biasanya, sekitar dari bola yang ditarik dalam percobaan adalah perak dan (karenanya) sekitar adalah fuchsia. Untuk mendapatkan lebih banyak bola perak, beberapa dari merekapX/np01/2X/nppn(1−p)npnHasil fuchsia harus berbeda. Seberapa besar kemungkinan bahwa kesempatan itu dapat beroperasi dengan cara ini? Jawaban yang jelas adalah bahwa ketika kecil, itu tidak pernah sangat mungkin bahwa kita akan menggambar bola perak. Dengan demikian, peluang kami untuk menggambar bola perak dan bukan yang fuchsia selalu rendah. Kami cukup mungkin berharap bahwa dengan keberuntungan murni, proporsi dari hasil fuchsia bisa berbeda, tetapi tampaknya tidak mungkin bahwa banyak lebih dari itu akan berubah. Dengan demikian, masuk akal bahwa tidak akan berbeda jauh lebih banyak dari . Secara ekuivalen, tidak akan berbeda jauh lebih banyak dari .ppXp×(1−p)nX/np(1−p)n/n=p(1−p)
The kesudahan
Dengan demikian kombinasi ajaib muncul. p(1−p) Ini hampir menjawab pertanyaan: kuantitas ini memuncak pada dan berkurang menjadi nol pada atau . Ini memberikan pembenaran intuitif namun kuantitatif untuk pernyataan bahwa "satu ekstrem lebih membatasi daripada yang lain" atau upaya lain semacam itu untuk menggambarkan apa yang kita ketahui.p = 0 p = 1p=1/2p=0p=1
Namun, tidak cukup nilai yang benar: itu hanya menunjukkan jalan, mengatakan kepada kita apa kuantitas harus peduli untuk memperkirakan penyebaran . Kami telah mengabaikan fakta bahwa keberuntungan juga cenderung untuk bertindak terhadap kami: seperti halnya beberapa bola fuchsia bisa jadi perak, beberapa bola perak bisa juga fuchsia. Menghitung semua kemungkinan secara ketat bisa menjadi rumit, tetapi hasilnya adalah bahwa alih-alih menggunakan sebagai batas yang masuk akal tentang seberapa banyak dapat menyimpang dari ekspektasinya , untuk menjelaskan semua hasil yang mungkin kita miliki dengan benar untuk mengambil akar kuadratX p ( 1 - p ) n Xp(1−p)Xp(1−p)nX√pn nX/n √p(1−p)n−−−−−−−−√. (Untuk penjelasan yang lebih cermat tentang alasannya, silakan kunjungi ( https://stats.stackexchange.com/a/3904 ). Membagi dengan , kita belajar bahwa variasi acak dari proporsi itu sendiri harus berada di urutan yang merupakan kesalahan standar .nX/np(1−p)n−−−−−−−−√/n=p(1−p)n−−−−−√,X/n
The distribusi binomial cenderung kasar simetris (untuk besar itu adalah mendekati normal ).n
Karena rasio harus antara 0 dan 1, ketidakpastian akan dibatasi oleh batas-batas ini. Kecuali jika rasio rata-rata tepat di tengah, salah satu batas ini akan lebih membatasi daripada yang lain.
Untuk kurva lonceng unimodal simetris yang berpusat pada agar sesuai dengan interval unit, setengah lebarnya harus kurang dari .p min[p,1−p]
sumber