Misalkan kita memiliki himpunan A dan himpunan bagian B. Jika kita tahu | A |, maka kita dapat menghitung | B | dengan menemukan probabilitas p bahwa suatu elemen yang dipilih secara seragam secara acak dari A adalah milik B. Secara khusus | A | p = | B |.
Misalkan kita menghasilkan n elemen A secara seragam secara acak dan menggunakan data ini untuk memperkirakan p (jumlah elemen dalam B dibagi n) dan karenanya mengestimasi | B |.
Seberapa andal perkiraan ini? Yaitu bagaimana kita bisa menghitung kesalahan?
Sebagai pertanyaan sampingan, apakah ada nama untuk teknik ini? (tampaknya menjadi versi matematika dari teknik mark-and-recapture )
estimation
Douglas S. Stones
sumber
sumber
Jawaban:
Anda memperkirakan proporsi. Untuk konkret, bayangkan bahwa A adalah populasi pemilih dan B adalah himpunan pemilih yang memilih kandidat tertentu. Dengan demikian, p akan menjadi persentase pemilih yang akan memilih kandidat itu. Membiarkan:
Dengan kata lain:
dimana
Kesalahan standar untuk perkiraan Anda adalah:
sumber