Kesalahan dalam memperkirakan ukuran set?

Misalkan kita memiliki himpunan A dan himpunan bagian B. Jika kita tahu | A |, maka kita dapat menghitung | B | dengan menemukan probabilitas p bahwa suatu elemen yang dipilih secara seragam secara acak dari A adalah milik B. Secara khusus | A | p = | B |.

Misalkan kita menghasilkan n elemen A secara seragam secara acak dan menggunakan data ini untuk memperkirakan p (jumlah elemen dalam B dibagi n) dan karenanya mengestimasi | B |.

Seberapa andal perkiraan ini? Yaitu bagaimana kita bisa menghitung kesalahan?

Sebagai pertanyaan sampingan, apakah ada nama untuk teknik ini? (tampaknya menjadi versi matematika dari teknik mark-and-recapture )

estimation Douglas S. Stones
sumber

Ini estimasi binomial . (Tidak ada tanda atau penangkapan kembali sama sekali. Yang mengarah pada estimasi hipergeometrik.)

whuber

Jawaban:

Anda memperkirakan proporsi. Untuk konkret, bayangkan bahwa A adalah populasi pemilih dan B adalah himpunan pemilih yang memilih kandidat tertentu. Dengan demikian, p akan menjadi persentase pemilih yang akan memilih kandidat itu. Membiarkan:

$\pi$

Dengan kata lain:

$\pi = \frac{|B|}{|A|}$

$\pi$ $\pi$

$p = \frac{n_B}{n}$

dimana

$n_B$ $n$

Kesalahan standar untuk perkiraan Anda adalah:

$\sqrt{\frac{\pi (1-\pi)}{n}}$

$\pi$

$\sqrt{\frac{p (1-p)}{n}}$

sumber