Saya memiliki tong campuran dengan jumlah kelereng yang tak terbatas. Ada kelereng dalam jumlah tak terbatas dalam tong, tetapi mereka hanya datang dalam beberapa varietas yang tidak diketahui tetapi terbatas : tidak diketahui, dan untuk , menggambar marmer tipe- lebih mungkin daripada menggambar marmer tipe- .
Dalam percobaan, sebuah mesin sampel tong menggunakan beberapa prosedur yang tidak diketahui. Mesin melaporkan satu set menggambarkan varietas kelereng dari sampelnya:
Uji coba percobaan ini diulangi ( diperbaiki di semua uji coba) dan kami mendapatkan urutan subset dari , .
Satu-satunya hal lain yang kita ketahui adalah:
- uji coba bersifat independen dan identik
- mesin melaporkan teratas yang paling sering terjadi dalam sampelnya
Kami tidak tahu persis bagaimana sampel mesin kelereng. Itu bisa memilih sejumlah besar kelereng, lalu melaporkan paling sering. Atau, bisa terus mengambil kelereng sampai ada varietas . Ada hal lain yang bisa dilakukan juga.
Apakah distribusi uji coba kami akan terpengaruh oleh prosedur pengambilan sampel mesin?
sumber
Jawaban:
Cara sederhana untuk memverifikasi bahwa metode itu penting adalah memilih probabilitas tertentu untuk jenis kelereng, dan menghitung peluang setiap subset sesuai dengan beberapa metode. Ini tidak dapat membuktikan bahwa metode ini tidak masalah.
Misalkan ada jenis dan peluang masing-masing jenis adalah , , dan . Misalkan Anda memilih jenis kelereng.3 1/2 1/4 1/4 2
Misalkan setelah memilih marmer, Anda mengabaikan sisanya. Peluang Anda mendapatkan adalah .{v2,v3} 2∗1/4∗1/3=1/6
Misalkan Anda menolak pasangan dengan tipe berulang. Peluang adalah{v2,v3}
Karena ini berbeda, metode mesin menggunakan hal-hal. Menolak pasangan dengan tipe yang berulang cenderung memberi bobot pada pasangan dengan tipe yang umum lebih sedikit.
Dua metode yang Anda sebutkan adalah setara. Mengabaikan sisa jenisnya setelah memetik marmer sama dengan memetik sampai Anda memiliki jenis yang berbeda.q
sumber