Apakah penting bagaimana Anda mengambil sampel suatu populasi?

9

Saya memiliki tong campuran dengan jumlah kelereng yang tak terbatas. Ada kelereng dalam jumlah tak terbatas dalam tong, tetapi mereka hanya datang dalam beberapa varietas yang tidak diketahui tetapi terbatas : tidak diketahui, dan untuk , menggambar marmer tipe- lebih mungkin daripada menggambar marmer tipe- .

V={v1,v2,v3,...,vk}
kijvivj

Dalam percobaan, sebuah mesin sampel tong menggunakan beberapa prosedur yang tidak diketahui. Mesin melaporkan satu set menggambarkan varietas kelereng dari sampelnya: Xqk

XV;|X|=q

Uji coba percobaan ini diulangi ( diperbaiki di semua uji coba) dan kami mendapatkan urutan subset dari , .qV(X1,X2,)

Satu-satunya hal lain yang kita ketahui adalah:

  • uji coba bersifat independen dan identik
  • mesin melaporkan teratas yang paling sering terjadi dalam sampelnyaq

Kami tidak tahu persis bagaimana sampel mesin kelereng. Itu bisa memilih sejumlah besar kelereng, lalu melaporkan paling sering. Atau, bisa terus mengambil kelereng sampai ada varietas . Ada hal lain yang bisa dilakukan juga.qq

Apakah distribusi uji coba kami akan terpengaruh oleh prosedur pengambilan sampel mesin?(X1,X2,)

Christian Chapman
sumber
3
+1 Ini adalah pertanyaan yang bagus karena menghargai bahwa ada lebih banyak pengambilan sampel acak daripada bentuk kesewenang-wenangan atau kurangnya pengetahuan tentang prosedur pengambilan sampel.
whuber
Aturan pengambilan sampel tentu akan menjadi masalah. Kalau tidak, pertimbangkan prosedur ini: mesin, pada setiap percobaan, selalu memilih satu marmer tipe 1 (varietas pertama). Setiap undian akan independen dan memiliki distribusi yang identik (sepele), dan Anda akan mendapatkan q = 1, hasil yang sangat tidak membantu.
AlaskaRon

Jawaban:

9

Cara sederhana untuk memverifikasi bahwa metode itu penting adalah memilih probabilitas tertentu untuk jenis kelereng, dan menghitung peluang setiap subset sesuai dengan beberapa metode. Ini tidak dapat membuktikan bahwa metode ini tidak masalah.

Misalkan ada jenis dan peluang masing-masing jenis adalah , , dan . Misalkan Anda memilih jenis kelereng.31/21/41/42

Misalkan setelah memilih marmer, Anda mengabaikan sisanya. Peluang Anda mendapatkan adalah .{v2,v3}21/41/3=1/6

Misalkan Anda menolak pasangan dengan tipe berulang. Peluang adalah{v2,v3}

21/41/421/41/4+21/21/4+21/21/4=1/81/8+1/4+1/4=1/5.

Karena ini berbeda, metode mesin menggunakan hal-hal. Menolak pasangan dengan tipe yang berulang cenderung memberi bobot pada pasangan dengan tipe yang umum lebih sedikit.

Dua metode yang Anda sebutkan adalah setara. Mengabaikan sisa jenisnya setelah memetik marmer sama dengan memetik sampai Anda memiliki jenis yang berbeda.q

Douglas Zare
sumber