Saya seorang pemula di statistik, jadi jika saya membuat asumsi yang salah di sini tolong katakan padaku.
Ada populasi N
orang. (Misalnya N
bisa 1.000.000.) Beberapa orang berambut merah. Saya mengambil sampel n
orang (katakanlah 10,) dan menemukan bahwa j
mereka adalah gadis berambut merah.
Apa yang bisa saya katakan tentang proporsi umum berambut merah dalam populasi? Maksud saya, perkiraan terbaik saya mungkin j/n
, tetapi apa yang akan menjadi standar deviasi dari perkiraan itu?
Ngomong-ngomong, apa istilah yang diterima untuk ini?
standard-deviation
sample-size
binomial
standard-error
Ram Rachum
sumber
sumber
Jawaban:
Anda dapat menganggap ini sebagai uji coba binomial - uji coba Anda menggunakan "redhead" atau "tidak readhead". Dalam hal ini, Anda dapat membangun interval kepercayaan untuk proporsi sampel Anda ( ) seperti yang didokumentasikan di Wikipedia:j/n
Interval kepercayaan 95% pada dasarnya mengatakan bahwa, menggunakan algoritma pengambilan sampel yang sama, jika Anda mengulangi ini 100 kali, proporsi sebenarnya akan berada pada interval yang dinyatakan 95 kali.
Pembaruan By the way, saya pikir istilah yang Anda cari mungkin kesalahan standar yang merupakan standar deviasi dari proporsi sampel. Dalam kasus ini, ini mana adalah proporsi estimasi Anda. Perhatikan bahwa saat bertambah, kesalahan standar berkurang.p(1−p)n−−−−−√ p n
sumber
jika ukuran sampel Anda tidak begitu kecil dari ukuran populasi seperti dalam contoh Anda, dan jika Anda mengambil sampel tanpa penggantian [Sw / oR], ekspresi yang lebih baik untuk [diperkirakan] SE adalahn N
di mana adalah estimasi proporsi dan .p^ j/n q^=1−p^
[istilah disebut FPC [koreksi populasi terbatas].N−nN
meskipun komentar whuber secara teknis benar, tampaknya menyarankan bahwa tidak ada yang bisa dilakukan untuk mendapatkan, katakanlah, interval kepercayaan untuk proporsi yang benar . jika cukup besar untuk membuat perkiraan normal masuk akal [ , katakanlah], kecil kemungkinannya seseorang akan mendapatkan . juga, jika ukuran sampel cukup besar untuk perkiraan normal menggunakan benar untuk masuk akal, menggunakan sebagai gantinya juga memberikan perkiraan yang masuk akal.p n np>10 j=0 SE SE^
[jika Anda benar-benar kecil dan Anda menggunakan Sw / oR, Anda mungkin harus menggunakan distribusi hypergeometrik yang tepat untuk alih-alih perkiraan normal. jika Anda melakukan SWR, ukuran tidak relevan dan Anda dapat menggunakan metode binomial yang tepat untuk mendapatkan CI untuk .]n j N p
dalam hal apa pun, karena , kita selalu bisa bersikap konservatif dan menggunakan sebagai pengganti di atas. jika Anda melakukannya, dibutuhkan sampel untuk mendapatkan perkiraan ME [margin of error = 2 ] dari .03 [terlepas dari seberapa besar adalah!].p(1−p)≤1/4 12n√ p^q^n−−−√ n=1,111 SE^ ± N
sumber