Apakah distribusi probabilitas guci berubah saat Anda menggambar darinya tanpa penggantian rata-rata?

9

Misalkan saya memiliki guci yang berisi N warna bola yang berbeda dan setiap warna yang berbeda dapat muncul beberapa kali berbeda (jika ada 10 bola merah tidak perlu ada juga 10 bola biru). Jika kita tahu isi guci yang tepat sebelum menggambar, kita dapat membentuk distribusi probabilitas diskrit yang memberi tahu kita kemungkinan menggambar setiap warna bola. Yang saya ingin tahu adalah bagaimana distribusi berubah setelah menggambar bola k tanpa rata-rata dari guci. Saya mengerti bahwa ketika kita menggambar dari guci kita dapat memperbarui distribusi dengan pengetahuan tentang apa yang telah dikeluarkan, tetapi apa yang ingin saya ketahui adalah apa yang kita harapkan dari bentuk distribusi setelah kita menghilangkan bola k. Apakah distribusi berubah rata-rata atau tetap sama? Jika tidak tetap sama, bisakah kita menuliskan beberapa formula untuk apa yang kita harapkan seperti distribusi rata-rata setelah membuat k draw?

mjnichol
sumber
1
saya mungkin salah - tetapi ini terasa seperti orang yang tahu distribusi sebelumnya, tetapi tidak memiliki informasi tentang kemungkinan (selain itu bola k dihapus). dalam hal ini - saya akan berasumsi bahwa posterior sama dengan sebelumnya. Agar adil - ada informasi kemungkinan bahwa jumlah bola telah menurun, dan bahwa (untuk satu bola dihilangkan) distribusi karenanya misalnya bimodal antara 50% kemungkinan 9 merah dan 10 hitam dan 50% kemungkinan 10 merah dan 9 hitam . saya mungkin salah di sini
Wouter
Intuisi saya adalah seperti kasus terakhir yang Anda gambarkan. Saya tidak dapat menemukan orang yang berbicara tentang proses semacam ini.
mjnichol

Jawaban:

7
  1. "Perhitungan langsung": Biarkan ada bola warna di dalam guci. Mari kita fokus pada kemungkinan menggambar satu warna tertentu, katakanlah putih , pada gambar kedua. Biarkan jumlah bola putih menjadi . Biarkan menjadi warna bola yang diperoleh pada undian ke- .m n w X i inmnwXii

    P(X2=W)=P(X2=W|X1=W)P(X1=W)+P(X2=W|X1=W¯)P(X1=W¯)=nw1n1nwn+nwn1nnwn=nw(nnw+nw1)n(n1)=nwn=P(X1=W)

    Tentu saja argumen yang sama ini berlaku untuk warna apa pun pada undian kedua. Kita bisa menerapkan jenis argumen yang sama secara rekursif ketika mempertimbangkan penarikan nanti.

    [Tentu saja orang bisa melakukan perhitungan yang lebih langsung. Pertimbangkan draw pertama yang terdiri dari white ball dan non-white balls (dengan probabilitas yang diberikan oleh distribusi hypergeometric), dan lakukan perhitungan yang sesuai dengan yang sederhana di atas tetapi untuk pengundian pada langkah ; seseorang mendapatkan penyederhanaan dan pembatalan yang serupa, tetapi tidak terlalu mencerahkan untuk dilakukan.]i k - i k + 1kikik+1

  2. Argumen yang lebih pendek: pertimbangkan memberi label bola secara acak dengan angka , dan kemudian menariknya dalam urutan berlabel. Pertanyaannya sekarang menjadi "Apakah probabilitas bahwa label yang diberikan, , ditempatkan pada bola putih sama dengan probabilitas label ditempatkan pada bola putih?"k 11,2,...,nk1

    Sekarang kita melihat jawabannya harus "ya" dengan simetri label. Demikian pula, dengan simetri warna bola, tidak masalah bahwa kami mengatakan "putih", sehingga argumen bahwa label dan label memiliki probabilitas yang sama berlaku untuk warna apa pun. Karenanya distribusi pada undian ke- sama dengan undian pertama, selama kami tidak memiliki informasi tambahan dari undian sebelumnya (yaitu selama bola yang digambar sebelumnya tidak terlihat).1 kk1k

Glen_b -Reinstate Monica
sumber
Terkait erat dengan cara ke-2 Anda, adalah argumen pendek lainnya: bayangkan rangkaian semua urutan yang memungkinkan di mana bola dapat dilepas (mis. Biru terlebih dahulu, kemudian putih, lalu putih, ... mungkin salah satu urutan seperti itu). Jika untuk setiap urutan dalam himpunan ini kita menukar elemen dan , kita cukup mengubah set. Jadi untuk setiap urutan dengan bola putih (atau apa pun) di posisi , ada tepat satu urutan yang sesuai dengan bola putih di posisi . Oleh karena itu probabilitas bola putih di posisi atau posisi harus sama. Saya pikir ini pada dasarnya argumen Neil. k t h k 1 k 11stkthk1k1
Silverfish
@ Silverfish Ya, melihatnya, argumen kedua saya pada dasarnya adalah jenis argumen yang sama dengan argumen permutasi Neil.
Glen_b -Reinstate Monica
Terima kasih untuk penjelasannya. Persis itulah yang perlu saya lihat!
mjnichol
6

Satu-satunya alasan tidak terlalu jelas bahwa distribusinya tidak berubah (asalkan setidaknya satu bola tersisa) adalah karena terlalu banyak informasi. Mari kita menanggalkan materi yang mengganggu.

kk+1kk


Argumen ini - walaupun sangat valid - dapat membuat beberapa orang merasa tidak nyaman. Analisis berikut mungkin diterima sebagai lebih keras, karena tidak meminta kami untuk mengabaikan urutan seleksi.

pkk+1pkpk0

CkCkCCn

Prk(C)=kcpknpk=kcn.

Ketika itu tidak bergantung pada , QED .kk<nk

whuber
sumber
Terima kasih atas komentarnya. Itu membantu saya lebih memahami proses yang mendasarinya!
mjnichol
2

Biarkan distribusi menggambar bola tunggal - setelah sudah menggambar bola tanpa penggantian - miliki distribusi kategori diberikan distribusi melalui distribusi kategori seperti .E ( D k ) D kkE(Dk)Dk

Saya kira Anda bertanya apakah konstan.E(Dk)

Aku rasa ini. Misalkan pada akhirnya Anda menggambar semua bola. Semua permutasi bola sama-sama mungkin. Probabilitas menggambar pada awalnya adalah . Anda bisa mengatur ulang pilihan Anda ke permutasi yang sama-sama memungkinkan di mana bola pilihan pertama Anda dipilih terakhir, dan pilihan kedua Anda dipilih terlebih dahulu. Bola itu memiliki ekspektasi , yang harus sama dengan karena simetri. Dengan induksi semuanya sama.E ( D 1 ) E ( D 0 ) E ( D i )E(D0)E(D1)E(D0)E(Di)

Neil G
sumber
Maksud Anda, saya bertanya apakah konstan untuk setiap k, bukan? E(Dk)
mjnichol
@ mjnichol benar
Neil G
0

"Distribusi yang diharapkan" tidak berubah. Orang bisa menggunakan argumen martingale! Saya akan menambahkan jawabannya nanti (saya bepergian sekarang).

Distribusi, tergantung pada undian sebelumnya (untuk undian berikutnya) lakukan perubahan hanya ketika Anda benar-benar mengamati undian. Jika Anda menggambar bola dari guci dengan tangan tertutup rapat, dan kemudian membuangnya tanpa memperhatikan warnanya (saya telah menggunakan teater seperti itu secara efektif sebagai demonstrasi kelas), distribusinya tidak berubah. Fakta ini memiliki penjelasan: Peluang adalah tentang informasi, Peluang adalah konsep informasi.

Jadi probabilitas berubah hanya ketika Anda mendapatkan informasi baru (probabilitas kondisional, yaitu). Menggambar bola dan membuangnya tanpa mengamatinya tidak memberi Anda informasi baru, jadi tidak ada yang baru untuk dikondisikan. Jadi ketika Anda mengkondisikan pada kumpulan informasi aktual, itu tidak berubah, sehingga distribusi bersyarat tidak dapat berubah.

 EDIT

Saya sekarang tidak akan memberikan lebih banyak detail untuk jawaban ini, hanya menambahkan satu referensi: Hosam M. Mahmoud: "Model Pólya Mm" (Chapman & Hall), yang memperlakukan model guci seperti yang ada dalam pertanyaan ini, dan juga guci yang lebih umum skema, juga dengan menggunakan metode martingale untuk memperoleh hasil batas. Tetapi metode martingale tidak diperlukan untuk pertanyaan di pos ini.

kjetil b halvorsen
sumber
Distribusi (untuk undian berikutnya) tidak berubah bahkan ketika Anda benar-benar mengamati undian. Mengapa mengamati sesuatu mengubah apa pun?
Neil G
1
@ Neil Saya pikir kjetil mengacu pada distribusi bersyarat pada undian yang diamati .
Silverfish
@Silverfish: Ah, begitu. Anda benar, permintaan maaf saya.
Neil G
Saya akan mengedit untuk membuat lebih jelas ketika di rumah dalam dua minggu. Untuk sekarang liburan di Venezia ...
kjetil b halvorsen