Apakah mungkin untuk memperkirakan peluang memenangkan kontes multi-entri, ketika saya tidak tahu rincian entri?

8

Misalkan saya mengikuti kontes , dengan aturan berikut:

  • Setiap orang dapat memperoleh hingga 6 entri
  • Semua entri akan dikumpulkan, dan 25% dari entri akan dipilih untuk menjadi pemenang, dengan maksimum 25.
  • Setiap orang hanya dapat menang sekali, terlepas dari jumlah entri mereka. Jika nama seseorang ditarik lagi, itu dibuang dan nama baru ditarik.
  • Saya tahu berapa banyak entri yang saya miliki (maksimum, 6)
  • Saya tahu ada berapa total entri, dikelompokkan berdasarkan jenis entri
  • Saya tidak tahu berapa banyak entri yang merupakan entri berulang oleh orang yang sama.

Hitungan entri menurut jenis adalah sebagai berikut:

Tipe 1: 42 Tipe 2: 72 Tipe 3: 119 Tipe 4: 217 Tipe 5: 156 Tipe 6: 178

Apakah mungkin untuk memperkirakan peluang saya untuk menang dalam situasi ini? Saya agak bingung dengan kenyataan bahwa saya tidak dapat memprediksi bagaimana pemenang awal akan mempengaruhi peluang saya, karena saya tidak tahu berapa banyak entri yang akan dihapus oleh setiap pemenang dari kumpulan.

Saya tertarik dengan solusi yang diberikan kumpulan data, tetapi saya juga tertarik pada prosedur / algoritma yang tepat untuk menghitungnya.

agent86
sumber
Apa yang dimaksud dengan "tipe"?
Makro
@Marco Berbagai jenis tiket yang bisa Anda dapatkan. Jadi, Anda bisa mendapatkan tiket lotre tipe 1 hingga 6, dan 42 orang memenangkan tiket tipe 1
Rachel
Saya mengalami kesulitan mengikuti urutan posting karena mereka berjalan dari bawah ke atas. Tetapi mengingat waktu di sebelah kanan nama poster, saya pikir saya sudah menemukannya. Begitu juga seseorang tolong beri tahu saya jika saya memiliki ini lurus. Saya pikir jawaban whuber tidak mungkin benar karena ambiguitas antara entri dan peserta. Strategi Rachel untuk mendapatkan skenario terburuk dan skenario terbaik adalah benar, tetapi ia membuat kesalahan matematika dengan menambahkan persentase ketika mereka dapat didasarkan pada penyebut yang berbeda. Jadi jika kita memperbaiki kesalahan itu, kita memiliki batas yang tepat pada solusinya.
Michael R. Chernick
Saya pikir itu aneh bagi Rachel untuk menyebut skenario kasus terbaik sebagai skenario yang memberikan persentase kemenangan tertinggi dan kasus terburuk yang memberikan skenario terendah. Menang itu bagus kan? Poin terakhir yang ingin saya klarifikasi: Kardinal menyatakan bahwa dalam kasus ini 25% dari peserta melebihi 25, jadi hanya akan ada 25 pemenang. Dia mendapatkan ini dengan mengetahui bahwa setidaknya 178 orang masuk dan tentu saja setelah jumlah pendatang melebihi 100 total pemenang dipotong pada 25 berdasarkan aturan.
Michael R. Chernick
@ kardinal, bagaimana Anda menemukan nomor 178? Saya menambahkan semua entri berdasarkan jenis untuk mendapatkan total 784. Dalam kasus terburuk bagi saya sebagai pemain, setiap orang mendapat 6 entri dan 784/6 = 130,7. Jadi saya menyimpulkan bahwa harus ada setidaknya 130 pintu masuk. Ini masih berarti cutoff 25 berlaku, tetapi bagaimana Anda sampai pada angka yang lebih tinggi?
Michael R. Chernick

Jawaban:

6

Peluang yang mungkin ada antara 17,7% dan 18,7%.

Kasus terburuk terjadi ketika semua orang tetapi Anda memiliki tepat satu entri dalam lotre: ini adalah konfigurasi yang konsisten dengan data (meskipun tidak mungkin!).

Mari kita hitung jumlah kemungkinan di mana Anda tidak menang. Ini adalah sejumlah cara menggambar25 tiket keluar dari 7846sisa tiket, diberikan oleh koefisien Binomial . (Ini jumlah yang sangat besar). Jumlah total kemungkinan - semuanya kemungkinan sama dalam gambar yang adil - adalah . Rasio ini disederhanakan menjadi , yaitu sekitar 82,22772%: peluang Anda untuk tidak menang. Karena itu peluang Anda untuk menang dalam situasi ini sama dengan 1 - 82.22772% = 17.7228% .(784625)(78425)(78425)(78430)/[(784)(7845)]

Kasus terbaik terjadi ketika ada beberapa individu yang terlibat dalam lotere sebanyak mungkin dan sebanyak mungkin memiliki , dan kemudian , dll, tiket. Mengingat bahwa jumlah "permata" adalah (dalam urutan menaik), ini menyiratkan65(42,72,119,156,178,217)

  • Paling banyak orang dapat memiliki entri masing-masing.42=a66

  • Paling banyak orang masing-masing dapat memiliki entri.7242=30=a55

    ...

  • Paling banyak orang masing-masing dapat memiliki entri.178156=22=a22

  • 217178=39=a1 orang masing-masing memiliki entri.1

Biarkan menentukan kesempatan untuk menang ketika Anda memegang (antara dan ) tiket dalam lotre dengan data dan draw. Jumlah tiket karena itu sama dengan . Pertimbangkan undian berikutnya. Ada tujuh kemungkinan:p(a,l,j)j16a=(a1,a2,,a6)l=251a1+2a2++6a6=n

  1. Salah satu tiket Anda diambil; kamu menang. Kesempatan ini sama dengan .j/n

  2. Tiket orang lain diambil. Peluang ini sama dengan . Jika mereka memegang dari mereka, maka semua tiket dihapus dari lotere. Jika , menggambar dilanjutkan dengan data baru: telah berkurang sebesar dan telah berkurang sebesar juga. Kesempatan bahwa beberapa orang dengan tiket dalam lotere dipilih, mengingat bahwa Anda tidak, sama dengan . Ini memberikan enam kemungkinan terpisah untuk .(nj)/niil1l1ai1iiai/(nj)i=1,2,,6

Kami menambahkan peluang ini karena mereka membagi semua hasil tanpa tumpang tindih.

Perhitungan berlanjut secara rekursif ke pohon probabilitas ini sampai semua daun pada tercapai. Ini banyak perhitungan (sekitar = 244 juta perhitungan), tetapi hanya membutuhkan beberapa menit (atau kurang, tergantung pada platform). Saya mendapatkan peluang 18,6475% untuk menang dalam kasus ini.l=0256

Ini kode Mathematica yang saya gunakan. (Hal ini ditulis untuk paralel analisis sebelumnya, itu bisa dibuat sedikit lebih efisien melalui beberapa aljabar pengurangan dan tes ketika dikurangi menjadi .) Di sini, argumen tidak tidak menghitung tiket Anda pegang: memberikan distribusi dari jumlah tiket yang dimiliki orang lain .ai0aj

p[a_, l_Integer, j_Integer] /; l >= 1 := p[a, l, j] = Module[{k = Length[a], n},
    n = Range[k] . a + j;
    j/n + (n - j)/n ParallelSum[
       i a[[i]] / (n - j) p[a - UnitVector[k, i], l - 1, j], {i, 1, k}]
    ];
p[a_, 0, j_Integer] := 0;
(* The data *)
a = Reverse[Differences[Prepend[Sort[{42, 72, 119, 217, 156, 178}], 0]]];
j = 6; l = 25;
(* The solution *)
p[a - UnitVector[Length[a],j], l, j] // N

Sebagai pengecekan realitas, mari kita bandingkan jawaban ini dengan dua perkiraan yang naif (tidak ada yang benar):

  1. 25 hasil imbang dengan 6 tiket bermain harus memberi Anda sekitar 6 * 25 dari 784 peluang menang. Ini adalah 19,1%.

  2. Setiap kali kesempatan Anda untuk tidak menang adalah sekitar (784-6) / 784. Naikkan ini ke kekuatan ke-25 untuk menemukan peluang Anda untuk tidak menang dalam lotre. Mengurangkannya dari 1 memberi 17,5%.

Sepertinya kita berada di stadion baseball yang tepat.

whuber
sumber
1
Saya suka masalah ini karena memberikan contoh nyata dari dua jenis ketidakpastian: ketidakpastian probabilitas dalam lotere dan kurangnya pengetahuan tentang distribusi sebenarnya dari kepemilikan tiket dalam lotere. Saya telah secara efektif menangani ketidakpastian yang terakhir dengan menggunakan analisis interval, yang hanya berusaha untuk mengikat kemungkinan seketat mungkin. Orang lain mungkin melanjutkan dan mengadopsi beberapa distribusi sebelumnya untuk menggambarkan ketidakpastian epistemik ini, tetapi saya dapat membayangkan tidak ada cara yang sah untuk membenarkan informasi semacam itu sebelum diberikan informasi yang ada.
whuber
Tetapi Anda berasumsi bahwa tidak ada yang dapat memiliki 2 atau lebih dari tiket jenis tertentu ("permata"). Sejauh yang saya bisa lihat ini tidak ditentukan dalam deskripsi OPs (agent86s) masalah.
Michael R. Chernick
@Michael Kau benar, itu tidak sepenuhnya jelas dalam aturan permainan, meskipun sangat tersirat bahwa tidak ada yang mengumpulkan lebih dari satu dari setiap jenis permata. Aturan vide 1 dalam pertanyaan awal: "setiap orang dapat memperoleh hingga 6 entri."
whuber
1
Sejauh yang saya ketahui (dan telah diperlihatkan selama kontes), asumsi dari informasi yang diberikan adalah benar - tidak ada satu orang yang dapat memiliki lebih dari 6 entri, satu dari masing-masing "tipe".
agent86
1
Terima kasih banyak telah meluangkan waktu untuk menjawab ini! Saya sudah memikirkan masalah ini sejak kemarin, dan bangun pagi ini memutuskan untuk mencari tahu ini jika itu membunuh saya, dan saya senang melihat penjelasan yang bagus sudah diposting jadi sekarang saya tidak perlu :)
Rachel
1

Jika saya melakukan matematika yang tepat, Anda memiliki antara 19.43%dan 21.15%kesempatan untuk memenangkan hadiah

Ini 19.43%adalah skenario terbaik, di mana setiap peserta memiliki 6 tiket

Ini 21.15%adalah skenario terburuk, di mana setiap peserta memiliki 1 tiket kecuali Anda

Kedua skenario ini sangat tidak mungkin, jadi peluang Anda yang sebenarnya untuk menang mungkin berada di antara keduanya, namun peluang sekitar 1/5 untuk menang tampaknya merupakan angka yang cukup solid.

Detail tentang bagaimana angka-angka itu diperoleh dapat ditemukan dalam spreadsheet Google ini , namun untuk meringkas bagaimana mereka diperoleh:

  1. Mulai dengan Total # Entri (784) dan Entri Anda (6)
  2. Dapatkan peluang menang ( 6 / 784 = 0.77%)
  3. Kurangi 6 untuk kasus terbaik, atau 1 untuk kasus terburuk dari TotalEntries
  4. Dapatkan peluang menang ( 6/778untuk kasus terbaik 6/783untuk kasus terburuk)
  5. Ulangi langkah 3-4 hingga Anda memiliki persentase 25
  6. Tambahkan 25 persen bersama-sama untuk mengetahui peluang keseluruhan Anda untuk memenangkan sesuatu

Berikut adalah cara alternatif untuk mendapatkan perkiraan persentase yang lebih sederhana, tetapi tidak seakurat karena Anda tidak menghapus entri duplikat setiap kali Anda menarik pemenang.

6 (your tickets) / 784 total tickets = 0.00765
0.00765 chance to win * 25 prizes = 19.14 % chance to win

EDIT: Saya cukup yakin saya kehilangan sesuatu dalam matematika saya dan Anda tidak bisa hanya menambahkan persentase seperti ini (atau gandakan peluang untuk menang dengan # hadiah), walaupun saya pikir saya sudah dekat

Komentar Whobar memberi peluang 17,4% untuk menang, meskipun saya masih perlu mencari tahu formula yang dia berikan dan memastikan itu akurat untuk kontes. Mungkin proyek akhir pekan :)

Rachel
sumber
Saya hanya akan menunjukkan bahwa ini mengasumsikan bahwa Anda memiliki 6 permata.
murgatroid99
@ murgatroid99 Ya, pertanyaannya I know how many entries I have (the maximum, 6):) Saya dapat membuat spreadsheet dapat diedit oleh siapa saja yang ingin mengetahui peluang mereka untuk menang
Rachel
2
Saya pikir angka-angka ini pada umumnya rata, tetapi turun beberapa persen. Sulit untuk mengatakannya karena deskripsi perhitungan yang Anda lakukan belum disediakan di pos itu sendiri.
kardinal
1
Dari keterangan Anda, tampaknya perbedaan tersebut kemungkinan timbul dari kenyataan bahwa Anda belum memasukkan kemungkinan sampai ke th langkah sebelum mendapatkan dipilih. Misalnya, dalam skenario terburuk, kemungkinan dipilih pada undian ketiga adalah . k(7787776)/(784783782)
kardinal
2
Rachel, memberikan peluang bahwa seseorang dengan tiket di antara akan memiliki setidaknya satu dari mereka yang dipilih ketika 25 sedang ditarik. (Ini didasarkan pada penghitungan berapa banyak cara tiket orang tidak dapat ditarik, membaginya dengan jumlah total penarikan yang mungkin, dan mengurangi rasio itu dari ) Untuk nilainya adalah 17,7%. Saya tidak tahu apakah ini cara lotere dimaksudkan untuk dijalankan. 1(n625)(n25)6n1n=784
whuber