Misalkan saya memiliki guci yang berisi N warna bola yang berbeda dan setiap warna yang berbeda dapat muncul beberapa kali berbeda (jika ada 10 bola merah tidak perlu ada juga 10 bola biru). Jika kita tahu isi guci yang tepat sebelum menggambar, kita dapat membentuk distribusi probabilitas diskrit yang memberi tahu kita kemungkinan menggambar setiap warna bola. Yang saya ingin tahu adalah bagaimana distribusi berubah setelah menggambar bola k tanpa rata-rata dari guci. Saya mengerti bahwa ketika kita menggambar dari guci kita dapat memperbarui distribusi dengan pengetahuan tentang apa yang telah dikeluarkan, tetapi apa yang ingin saya ketahui adalah apa yang kita harapkan dari bentuk distribusi setelah kita menghilangkan bola k. Apakah distribusi berubah rata-rata atau tetap sama? Jika tidak tetap sama, bisakah kita menuliskan beberapa formula untuk apa yang kita harapkan seperti distribusi rata-rata setelah membuat k draw?
sumber
Jawaban:
"Perhitungan langsung": Biarkan ada bola warna di dalam guci. Mari kita fokus pada kemungkinan menggambar satu warna tertentu, katakanlah putih , pada gambar kedua. Biarkan jumlah bola putih menjadi . Biarkan menjadi warna bola yang diperoleh pada undian ke- .m n w X i in m nw Xi i
Tentu saja argumen yang sama ini berlaku untuk warna apa pun pada undian kedua. Kita bisa menerapkan jenis argumen yang sama secara rekursif ketika mempertimbangkan penarikan nanti.
[Tentu saja orang bisa melakukan perhitungan yang lebih langsung. Pertimbangkan draw pertama yang terdiri dari white ball dan non-white balls (dengan probabilitas yang diberikan oleh distribusi hypergeometric), dan lakukan perhitungan yang sesuai dengan yang sederhana di atas tetapi untuk pengundian pada langkah ; seseorang mendapatkan penyederhanaan dan pembatalan yang serupa, tetapi tidak terlalu mencerahkan untuk dilakukan.]i k - i k + 1k i k−i k+1
Argumen yang lebih pendek: pertimbangkan memberi label bola secara acak dengan angka , dan kemudian menariknya dalam urutan berlabel. Pertanyaannya sekarang menjadi "Apakah probabilitas bahwa label yang diberikan, , ditempatkan pada bola putih sama dengan probabilitas label ditempatkan pada bola putih?"k 11,2,...,n k 1
Sekarang kita melihat jawabannya harus "ya" dengan simetri label. Demikian pula, dengan simetri warna bola, tidak masalah bahwa kami mengatakan "putih", sehingga argumen bahwa label dan label memiliki probabilitas yang sama berlaku untuk warna apa pun. Karenanya distribusi pada undian ke- sama dengan undian pertama, selama kami tidak memiliki informasi tambahan dari undian sebelumnya (yaitu selama bola yang digambar sebelumnya tidak terlihat).1 kk 1 k
sumber
Satu-satunya alasan tidak terlalu jelas bahwa distribusinya tidak berubah (asalkan setidaknya satu bola tersisa) adalah karena terlalu banyak informasi. Mari kita menanggalkan materi yang mengganggu.
Argumen ini - walaupun sangat valid - dapat membuat beberapa orang merasa tidak nyaman. Analisis berikut mungkin diterima sebagai lebih keras, karena tidak meminta kami untuk mengabaikan urutan seleksi.
Ketika itu tidak bergantung pada , QED .kk<n k
sumber
Biarkan distribusi menggambar bola tunggal - setelah sudah menggambar bola tanpa penggantian - miliki distribusi kategori diberikan distribusi melalui distribusi kategori seperti .E ( D k ) D kk E(Dk) Dk
Saya kira Anda bertanya apakah konstan.E(Dk)
Aku rasa ini. Misalkan pada akhirnya Anda menggambar semua bola. Semua permutasi bola sama-sama mungkin. Probabilitas menggambar pada awalnya adalah . Anda bisa mengatur ulang pilihan Anda ke permutasi yang sama-sama memungkinkan di mana bola pilihan pertama Anda dipilih terakhir, dan pilihan kedua Anda dipilih terlebih dahulu. Bola itu memiliki ekspektasi , yang harus sama dengan karena simetri. Dengan induksi semuanya sama.E ( D 1 ) E ( D 0 ) E ( D i )E(D0) E(D1) E(D0) E(Di)
sumber
"Distribusi yang diharapkan" tidak berubah. Orang bisa menggunakan argumen martingale! Saya akan menambahkan jawabannya nanti (saya bepergian sekarang).
Distribusi, tergantung pada undian sebelumnya (untuk undian berikutnya) lakukan perubahan hanya ketika Anda benar-benar mengamati undian. Jika Anda menggambar bola dari guci dengan tangan tertutup rapat, dan kemudian membuangnya tanpa memperhatikan warnanya (saya telah menggunakan teater seperti itu secara efektif sebagai demonstrasi kelas), distribusinya tidak berubah. Fakta ini memiliki penjelasan: Peluang adalah tentang informasi, Peluang adalah konsep informasi.
Jadi probabilitas berubah hanya ketika Anda mendapatkan informasi baru (probabilitas kondisional, yaitu). Menggambar bola dan membuangnya tanpa mengamatinya tidak memberi Anda informasi baru, jadi tidak ada yang baru untuk dikondisikan. Jadi ketika Anda mengkondisikan pada kumpulan informasi aktual, itu tidak berubah, sehingga distribusi bersyarat tidak dapat berubah.
Saya sekarang tidak akan memberikan lebih banyak detail untuk jawaban ini, hanya menambahkan satu referensi: Hosam M. Mahmoud: "Model Pólya Mm" (Chapman & Hall), yang memperlakukan model guci seperti yang ada dalam pertanyaan ini, dan juga guci yang lebih umum skema, juga dengan menggunakan metode martingale untuk memperoleh hasil batas. Tetapi metode martingale tidak diperlukan untuk pertanyaan di pos ini.
sumber