Gulung dadu hingga mendarat pada angka apa pun selain 4. Berapa probabilitas hasilnya> 4?

20

Seorang pemain diberi dadu yang adil dan bersisi enam. Untuk menang, ia harus memutar angka lebih besar dari 4 (yaitu, 5 atau 6). Jika dia menggulung 4, dia harus menggulung lagi. Apa peluangnya untuk menang?

Saya pikir probabilitas memenangkan P(W) , dapat dinyatakan secara rekursif sebagai:

P(W)=P(r=5r=6)+P(r=4)P(W)

Saya telah memperkirakan P(W) sebagai 0.3999 dengan menjalankan 1 juta percobaan di Jawa, seperti ini:

import java.util.Random;
public class Dice {

    public static void main(String[] args) {
        int runs = 1000000000;
        int wins = 0;
        for (int i = 0; i < runs; i++) {
            wins += playGame();
        }
        System.out.println(wins / (double)runs);
    }

    static Random r = new Random();

    private static int playGame() {
        int roll;
        while ((roll = r.nextInt(6) + 1) == 4);
        return (roll == 5 || roll == 6) ? 1 : 0;
    }
}

Dan saya melihat seseorang dapat mengembangkan seperti ini:P(W)

P(W)=13+16(13+16(13+16))...

Tapi saya tidak tahu bagaimana menyelesaikan hubungan perulangan jenis ini tanpa menggunakan pendekatan semacam ini. Apa itu mungkin?

tronbabylove
sumber
6
Itu banyak upaya untuk mengatur hubungan perulangan. Anda memiliki alasan kuat untuk meyakini bahwa jawabannya adalah 0,4. Itu petunjuk kuat bahwa ada cara lain untuk memikirkan masalah yang membuat Anda mendapatkan jawabannya secara langsung. Carilah itu. Jawaban Geomatt akan membawa Anda ke sana, yang pada gilirannya akan membantu Anda memahami apa yang terjadi di sini dan bahkan membantu Anda menyederhanakan masalah lain yang Anda temui lebih cepat tanpa upaya semacam ini. Jika masalah yang tampaknya rumit tampaknya memiliki jawaban sederhana, Anda harus selalu menginvestasikan waktu untuk mencoba mencari tahu alasannya. Membayar dividen besar nanti.
Joel
8
Setelah Anda menyadari bahwa karena probabilitas yang sama dari keenam hasil dan kemandirian gulungan tidak ada yang istimewa tentang hasil tertentu dari percobaan ini, jelas bahwa kelima hasil yang mungkin sama-sama memungkinkan.
whuber
6
Saya sedikit kecewa tidak ada yang memasang solusi Rantai Markov menyerap untuk ini :-) Math Stack Exchange memiliki tradisi mulia dari "solusi berlebihan" yang jarang tampaknya meresap ke Cross Validated ...
Silverfish
2
Ini adalah 2/5 untuk memilih salah satu dari dari { 1 , 2 , 3 , 5 , 6 } sehingga simulasi Anda mungkin benar.{5,6}{1,2,3,5,6}
mathreadler
2
Posting ini vs jawaban adalah apa yang saya bayangkan para ilmuwan data seperti vs statistik.
bdeonovic

Jawaban:

47

Pecahkan saja dengan menggunakan aljabar:

P(W)=26+16P(W)56P(W)=26P(W)=25.
dsaxton
sumber
2
Perhatikan bahwa perhitungan ini hanya valid karena Strong Markov Property berlaku untuk rantai Markov yang terpisah.
Chill2Macht
Saya tidak ingat rantai Markov diskrit saya, tapi, saya akan bahaya, dari matematika sederhana, yang Anda maksudkan bahwa hubungan perulangan hanya valid karena Properti Markov Kuat. Setelah relasi terbentuk, kita baru menyelesaikan x.
josinalvo
Apakah ini benar?
josinalvo
1
@ josinalvo: Secara teknis, pertanyaannya adalah apakah P (W) di kedua sisi persamaan berarti sama. The Strong Markov Property menyiratkan mereka melakukannya. Dengan tidak adanya properti itu, P (W) di sisi kiri berarti "kesempatan untuk menang dengan gulungan ini" dan 1/6 * P (W) di sebelah kanan berarti "kesempatan untuk menang setelah menggulirkan angka 4".
MSalters
81

Catatan: Ini adalah jawaban untuk pertanyaan awal, bukan pengulangan.

Jika dia menggulung 4, maka itu pada dasarnya tidak masuk hitungan, karena gulungan berikutnya independen. Dengan kata lain, setelah memutar angka 4 situasinya sama dengan ketika dia mulai. Jadi Anda bisa mengabaikan 4. Lalu hasil yang bisa berarti adalah 1-3 dan 5-6. Ada 5 hasil berbeda, 2 di antaranya menang. Jadi jawabannya adalah 2/5 = 0,4 = 40%.

GeoMatt22
sumber
8
Anda dapat membuat ini sedikit lebih langsung: "Pertimbangkan gulungan pertama yang bukan 4. Lalu hasilnya ..."
Joel
2
Mata kebanyakan orang berguling ketika mereka melihat banyak matematika, jadi saya lebih suka yang ini. Pada dasarnya Anda mengeluarkan 4 dari hasil, jadi 1, 2, 3, 5, 6. Jelas Anda memiliki 40% peluang pada saat itu.
Nelson
Saya memikirkan hal ini dari judul, jadi kebanyakan hanya membaca sepintas pertanyaan lengkap setelah saya mengkliknya. Kalau tidak, aku mungkin akan bingung sendiri dan menebak-nebak!
GeoMatt22
1
@Nelson Saya telah melihat banyak orang yang matanya berguling ketika mereka melihat semacam ini penalaran dalam masalah probabilitas dari orang yang matanya berguling ketika mereka melihat . p=a+bp
JiK
Iya nih. Moral dari cerita ini adalah: jangan mencoba membuat masalah lebih sulit daripada yang seharusnya.
Jay
14

Jawaban oleh dsaxton ( /stats//a/232107/90759 ) dan GeoMatt22 ( /stats//a/232107/90759 ) memberikan pendekatan terbaik untuk masalah tersebut. Yang lain adalah menyadari bahwa ekspresimu

P(W)=13+16(13+16())

Benar-benar kemajuan geometris :

13+1613+16213+

Secara umum kita miliki

n=0a0qn=a01q

jadi di sini kita miliki

P(W)=13116=13:56=615=25.

Of course, the way to prove the general formula for the sum of a geometric progression, is by using an algebraic solution similarly to dsaxton.

Meni Rosenfeld
sumber
@William, I don't think your comment is appropriate for several reasons. 1. I never said that you need geometric series for this. 2. The concepts you use in your answer are much heavier machinery, it's ironic to say "you don't need geometric series! You just need the much more advanced and sophisticated strong Markov property". 3. A solution which is simple and rigorous was already provided by dsaxton. Your method is more roundabout and overkill for this problem. 4. The OP already had an expression equivalent to a geometric series, someone had to address that, may as well be me.
Meni Rosenfeld
1
@ William: Pada akhirnya, jawaban Anda sendiri baik-baik saja, berwawasan luas, dan merupakan tambahan yang berguna untuk kumpulan jawaban atas pertanyaan. Itu tidak berarti Anda harus mencari setiap jawaban lain dan mengatakan bahwa jawaban Anda jauh lebih baik. Mereka semua baik-baik saja juga. Tidak semuanya harus didekati dengan cara yang paling abstrak dan umum.
Meni Rosenfeld
Sudah lama sejak saya menjadi jurusan matematika, jadi saya minta maaf jika jawaban saya kurang keras. (Tolong jangan bilang itu bergantung pada aksioma pilihan , karena itu akan memalukan!) :)
GeoMatt22
3

All of the above answers are correct, but they don't explain why they are correct, and why you can ignore so many details and avoid having to solve a complicated recurrence relation.

The reason why the other answers are correct is the Strong Markov property, which for a discrete Markov Chain is equivalent to the regular Markov property. https://en.wikipedia.org/wiki/Markov_property#Strong_Markov_property

Basically the idea is that the random variable

τ:=(the number of times until the die does not land on 4 for the first time)

is a stopping time. https://en.wikipedia.org/wiki/Stopping_time A stopping time is a random variable which doesn't depend on any future information.

In order to tell whether the nth roll of the die is the first one which has not landed on a 4 (i.e. in order to decide whether τ=n), you only need to know the value of the current roll, and of all previous rolls, but not of any future rolls -- thus τ is a stopping time, and the Strong Markov property applies.

What does the Strong Markov property say? It says that the number which the die lands on at the τth roll, as a random variable, Xτ, is independent of the values of ALL previous rolls.

So if the die rolls 4 once, twice, ..., 50 million times, ..., τ1 times before finally landing on another value for the τth roll, it won't affect the probability of the event that Xτ>4.

P(Xτ>4|τ=1)=P(Xτ>4|τ=2)==P(Xτ>4|τ=50,000,000)=

Therefore we can assume, without loss of generality, that τ=1. This is just the probability that the die lands a value greater than 4 given that it does not land on 4, which we can calculate very easily:

P(X1>4|X4)=P(X1>4X14)P(X14)=P(X1>4)P(X14)=1356=1365=25
which of course is the correct answer.

You can read more about stopping times and the Strong Markov property in Section 8.3 of (the 4th edition of) Durrett's Probability Theory and Examples, p. 365.

Chill2Macht
sumber
As far as I can tell from the wiki entry, the existence of a stopping time is necessary but not sufficient to say that a series of events exhibits the SMP. Sorry if I'm missing an in-joke or profound insight, but why not just assume that rolls are independent and get on with it?
Jacob Raihle
@JacobRaihle "Strong Markov property, which for a discrete Markov Chain is equivalent to the regular Markov property." This scenario clearly constitutes a discrete Markov chain. The rolls are independent, that's why it's a discrete Markov chain. The issue is that the event "first roll which does not land on 4" is not independent of the previous rolls, for reasons which are hopefully obvious.
Chill2Macht
It's equally clear that the rolls are independent. So what additional benefit does the SMP provide?
Jacob Raihle
@JacobRaihle Even though the value of the rolls are independent, the value of the die the first time it lands on a value not equal to 4 is NOT independent of the values on which the die landed on previous rolls.
Chill2Macht
It should be, since the rolling stops as soon as that happens. There can be no non-4 roll that isn't also the first one. And even if that were not the case, I'm not sure what kind of relationship you are suggesting.
Jacob Raihle
1

Another way to look at the problem.

Lets call a 'real result' a 1,2,3,5 or 6.

What is the probability of winning on the first roll, if you got a 'real result'? 2/5

What is the probability of winning on the second roll, if the second roll is the first time you got a 'real result'? 2/5

Same for third, fourth.

So, you can break your sample in (infinte) smaller samples, and those samples all give the same probability.

josinalvo
sumber