Saya mengerti bahwa ketika pengambilan sampel dari populasi terbatas dan ukuran sampel kami lebih dari 5% dari populasi, kita perlu melakukan koreksi pada mean sampel dan kesalahan standar menggunakan rumus ini:
Di mana adalah ukuran populasi dan adalah ukuran sampel.
Saya punya 3 pertanyaan tentang formula ini:
- Mengapa ambang batas ditetapkan pada 5%?
- Bagaimana rumus itu diturunkan?
- Apakah ada sumber daring lain yang menjelaskan rumus ini secara komprehensif selain makalah ini ?
Jawaban:
Ambang dipilih sedemikian rupa sehingga memastikan konvergensi distribusi hypergeometrik ( adalah SD-nya), alih-alih distribusi binomial (untuk pengambilan sampel dengan penggantian), ke distribusi normal ( ini adalah Teorema Limit Pusat, lihat misal, Kurva Normal, Teorema Limit Pusat, dan Ketidaksamaan Markov dan Chebychev untuk Variabel Acak ). Dengan kata lain, ketika (yaitu, tidak 'terlalu besar' dibandingkan dengan ), FPC dapat dengan aman diabaikan; mudah untuk melihat bagaimana faktor koreksi berkembang dengan variasi untuk tetap : dengan , kita milikiN- nN- 1----√ n / T≤ 0,05 n N n N N= 10 , 000 FPC = .9995 ketika sementara ketika . Ketika , FPC mendekati 1 dan kami dekat dengan situasi pengambilan sampel dengan penggantian (yaitu, seperti dengan populasi tanpa batas).n = 10 FPC = .3162 n = 9 , 000 N→ ∞
Untuk memahami hasil ini, titik awal yang baik adalah membaca beberapa tutorial online tentang teori sampling di mana pengambilan sampel dilakukan tanpa penggantian ( simple random sampling ). Tutorial online tentang statistik Nonparametrik ini memiliki ilustrasi tentang menghitung ekspektasi dan varian totalnya.
Anda akan melihat bahwa beberapa penulis menggunakan bukan dalam penyebut FPC; sebenarnya, itu tergantung pada apakah Anda bekerja dengan sampel atau statistik populasi: untuk varians, itu akan menjadi bukan jika Anda tertarik pada daripada .N N- 1 N N- 1 S2 σ2
Adapun referensi online, saya dapat menyarankan Anda
sumber