Kesalahan dalam memperkirakan ukuran set?

9

Misalkan kita memiliki himpunan A dan himpunan bagian B. Jika kita tahu | A |, maka kita dapat menghitung | B | dengan menemukan probabilitas p bahwa suatu elemen yang dipilih secara seragam secara acak dari A adalah milik B. Secara khusus | A | p = | B |.

Misalkan kita menghasilkan n elemen A secara seragam secara acak dan menggunakan data ini untuk memperkirakan p (jumlah elemen dalam B dibagi n) dan karenanya mengestimasi | B |.

Seberapa andal perkiraan ini? Yaitu bagaimana kita bisa menghitung kesalahan?

Sebagai pertanyaan sampingan, apakah ada nama untuk teknik ini? (tampaknya menjadi versi matematika dari teknik mark-and-recapture )

Douglas S. Stones
sumber
1
Ini estimasi binomial . (Tidak ada tanda atau penangkapan kembali sama sekali. Yang mengarah pada estimasi hipergeometrik.)
whuber

Jawaban:

8

Anda memperkirakan proporsi. Untuk konkret, bayangkan bahwa A adalah populasi pemilih dan B adalah himpunan pemilih yang memilih kandidat tertentu. Dengan demikian, p akan menjadi persentase pemilih yang akan memilih kandidat itu. Membiarkan:

π

Dengan kata lain:

π=|B||A|

ππ

p=nBn

dimana

nBn

Kesalahan standar untuk perkiraan Anda adalah:

π(1π)n

π

p(1p)n


sumber