Masalah Monty Hall dengan Monty Fallible

23

Monty memiliki pengetahuan sempurna tentang apakah Pintu memiliki kambing di belakangnya (atau kosong). Fakta ini memungkinkan Player untuk Menggandakan tingkat keberhasilannya dari waktu ke waktu dengan mengalihkan "tebakan" ke Pintu lainnya. Bagaimana jika pengetahuan Monty kurang sempurna? Bagaimana jika Hadiah terkadang benar-benar ada di Pintu yang sama dengan Kambing? Tetapi Anda tidak dapat melihatnya sampai setelah Anda memilih dan membuka pintu ANDA? Bisakah Anda membantu saya memahami bagaimana cara menghitung IF— dan seberapa banyak - Pemain dapat meningkatkan kesuksesannya ketika tingkat akurasi Monty kurang dari 100%? Sebagai contoh: bagaimana jika Monty salah - Rata-rata-50% dari waktu? Bisakah Pemain MENDAPAT manfaat dari mengganti Tebak / Pintu? Saya membayangkan bahwa jika Monty memiliki kurang dari 33,3% peluang untuk menjadi benar bahwa Hadiah TIDAK di balik Pintu, maka opsi terbaik Pemain adalah untuk TIDAK Beralih ke pilihan Pintu nya. Bisakah Anda memberi saya cara untuk menghitung manfaat potensial dari beralih dengan memasukkan berbagai Kemungkinan Monty yang Benar tentang Hadiah yang TIDAK berada di belakang Pintu? Saya tidak memiliki apapun selain matematika SMA, dan saya berusia 69 tahun, jadi harap bersikap lembut.


Terima kasih atas wawasan dan formula yang diberikan. Tampaknya jika "Fallible Monty" hanya 66% akurat dalam memprediksi tidak adanya Hadiah / Mobil maka ada NOL manfaat untuk beralih dari pintu pilihan awal Anda .... karena tingkat kesalahan 33% adalah default tarif dasar untuk Hadiah yang berada di balik pintu APA PUN. Satu mengasumsikan, bahwa JIKA Monty menjadi lebih baik dari 66% dalam memprediksi di mana TIDAK ADA HADIAH KEMUDIAN beralih memperoleh Utilitas yang lebih besar. Saya akan mencoba menerapkan alasan ini pada permainan di mana "Pakar" membuat "prediksi ahli" bahwa salah satu dari tiga opsi yang kira-kira sama-sama mungkin adalah yang benar. Saya kurang percaya pada Pakar yang benar, dan saya cukup yakin bahwa "hit rate-nya" akan kurang dari 33% - lebih seperti 15%. Kesimpulan saya dari ini adalah bahwa ketika "opsi yang sama dengan saya, saya mungkin salah pasti, dan harus berubah ke salah satu dari dua lainnya! ;-)

Pseudoego
sumber
5
Jika akurasi Monty kurang dari 100%, apakah itu berarti dia terkadang membuka pintu dengan hadiah di belakangnya? Jika demikian, Anda mungkin harus memilih pintu itu.
Faks

Jawaban:

35

Mari kita mulai dengan masalah Monty Hall biasa. Tiga pintu, di belakang salah satunya adalah mobil. Dua lainnya memiliki kambing di belakang mereka. Anda memilih pintu nomor 1 dan Monty membuka pintu nomor 2 untuk menunjukkan kepada Anda ada seekor kambing di belakangnya. Haruskah Anda mengalihkan tebakan Anda ke pintu nomor 3? (Perhatikan bahwa angka yang kita gunakan untuk merujuk ke setiap pintu tidak penting di sini. Kita dapat memilih urutan apa pun dan masalahnya sama, jadi untuk menyederhanakan hal-hal yang kita bisa menggunakan penomoran ini.)

Jawabannya tentu saja adalah ya, seperti yang sudah Anda ketahui, tetapi mari kita lihat perhitungan untuk melihat bagaimana mereka berubah nanti. Biarkan C menjadi indeks pintu dengan mobil dan M menunjukkan acara yang Monty mengungkapkan bahwa pintu 2 memiliki seekor kambing. Kita perlu menghitung p(C=3|M) . Jika ini lebih besar dari 1/2 , kita perlu beralih menebak kami ke pintu itu (karena kita hanya memiliki dua pilihan yang tersisa). Probabilitas ini diberikan oleh:

p(C=3|M)=p(M|C=3)p(M|C=1)+p(M|C=2)+p(M|C=3)
(Ini hanya menerapkan aturan Bayes dengan flat sebelum padaC)p(M|C=3)sama dengan 1: jika mobil di belakang pintu nomor 3 maka Monty tidak punya pilihan selain membuka pintu nomor 2 seperti yang dia lakukan. p(M|C=1)sama dengan1/2 : jika mobil berada di belakang pintu 1, maka Monty punya pilihan untuk membuka salah satu pintu yang tersisa, 2 atau 3.p(M|C=2) sama dengan 0, karena Monty tidak pernah membuka pintu yang dia tahu memiliki mobil. Mengisi angka-angka ini, kita mendapatkan:
p(C=3|M)=10.5+0+1=23
Yang mana hasilnya kita kenal.

Sekarang mari kita perhatikan kasus di mana Monty tidak memiliki pengetahuan yang sempurna tentang pintu mana yang memiliki mobil. Jadi, ketika dia memilih pintu (yang akan kita sebut sebagai pintu nomor 2), dia mungkin secara tidak sengaja memilih yang memiliki mobil, karena dia pikir dia memiliki seekor kambing. Biarkan C menjadi pintu yang menurut Monty memiliki mobil, dan biarkan p(C|C) menjadi probabilitas bahwa ia mengira mobil itu berada di tempat tertentu, tergantung pada lokasi sebenarnya. Kami akan menganggap bahwa ini dijelaskan oleh parameter tunggal q yang menentukan akurasinya, sehingga: p(C=x|C=x)=q=1p(Cx|C=x) . Jikaq sama dengan 1, Monty selalu benar. Jikaq adalah 0, Monty selalu salah (yang masih informatif). Jikaq adalah1/3 , informasi Monty tidak lebih baik dari menebak acak.

Ini berarti bahwa kita sekarang memiliki:

p(M|C=3)=xp(M|C=x)p(C=x|C=3)
=p(M|C=1)p(C=1|C=3)+p(M|C=2)p(C=2|C=3)+p(M|C=3)p(C=3|C=3)
=12×12(1q)+0×12(1q)+1×q
=14q4+q=34q+14

Artinya, jika mobil itu benar-benar di belakang pintu 3, ada tiga kemungkinan yang bisa dimainkan: (1) Monty pikir itu di belakang 1, (2) Monty berpikir 2 atau (3) Monty berpikir 3. Pilihan terakhir terjadi dengan probabilitas q (seberapa sering ia melakukannya dengan benar), dua lainnya membagi probabilitas bahwa ia salah (1q) antara mereka. Kemudian, mengingat setiap skenario, berapakah probabilitas bahwa ia akan memilih untuk menunjuk ke pintu nomor 2, seperti yang ia lakukan? Jika dia mengira mobil itu di belakang 1, probabilitas itu adalah 1 dalam 2, karena dia bisa memilih 2 atau 3. Jika dia pikir itu di belakang 2, dia tidak akan pernah memilih untuk menunjuk pada 2. Jika dia mengira itu di belakang 3 , dia akan selalu memilih 2.

Kami sama dapat bekerja di luar probabilitas yang tersisa:

p(M|C=1)=xp(M|C=x)p(C=x|C=1)
=12×q+1×12(1q)
=q2+12q2=12

p(M|C=2)=xp(M|C=x)p(C=x|C=2)
=12×12(1q)+1×12(1q)
=3434q

Mengisi semua ini, kita mendapatkan:

p(C=3|M)=34q+1412+3434q+34q+14
=0.75q+0.251.5
Sebagai pemeriksaan kewarasan, ketikaq=1, kita dapat melihat bahwa kita mendapatkan kembali jawaban asli kita dari11.5=23 .

Jadi, kapan kita harus beralih? Saya akan berasumsi untuk kesederhanaan bahwa kita tidak diizinkan untuk beralih ke pintu yang ditunjuk Monty. Dan pada kenyataannya, selama Monty setidaknya agak mungkin benar (lebih daripada menebak secara acak), pintu yang ditunjuknya akan selalu lebih kecil kemungkinannya daripada yang lain untuk memiliki mobil, jadi ini bukan pilihan yang layak. untuk kita. Jadi kita hanya perlu mempertimbangkan probabilitas pintu 1 dan 3. Tapi sementara dulu tidak mungkin bagi mobil untuk berada di belakang pintu 2, opsi ini sekarang memiliki probabilitas tidak nol, dan jadi tidak lagi kita harus beralih ketika p(C=3|M)>0.5 , tetapi kita harus beralih ketika p(C=3|M)>p(C=1|M) (yang dulunya adalah hal yang sama). Probabilitas ini diberikan olehp(C=1|M)=0.51.5=13 , sama seperti dalam masalah Monty Hall yang asli. (Ini masuk akal karena Monty tidak pernah dapat menunjuk ke pintu 1, terlepas dari apa yang ada di baliknya, dan karenanya ia tidak dapat memberikan informasi tentang pintu itu. Sebaliknya, ketika akurasinya turun di bawah 100%, efeknya adalah bahwa beberapa kemungkinan "bocor" ke pintu 2 benar-benar memiliki mobil.) Jadi, kita perlu menemukanqsedemikian rupa sehinggap(C=3|M)>13 :

0.75q+0.251.5>13
0.75q+0.25>0.5
0.75q>0.25
q>13
Jadi pada dasarnya, ini adalah cara yang sangat bertele-tele untuk mengetahui bahwa, selama pengetahuan Monty tentang lokasi sebenarnya mobil itu lebih baik daripada perkiraan acak, Anda harus berganti pintu (yang sebenarnya agak jelas, ketika Anda berpikir tentang saya t). Kita juga dapat menghitung seberapa besar kemungkinan kita menang ketika kita beralih, sebagai fungsi akurasi Monty, karena ini diberikan oleh:
p(C=3|M)p(C=1|M)
=0.75q+0.251.513=1.5q+0.5
(Yang mana, ketikaq=1, memberikan jawaban 2, cocok dengan fakta bahwa kami menggandakan peluang kami untuk menang dengan mengganti pintu dalam masalah Monty Hall yang asli.)

Sunting: Orang-orang bertanya tentang skenario di mana kita diizinkan untuk beralih ke pintu yang ditunjuk Monty, yang menjadi menguntungkan ketika q<13 , yaitu ketika Monty adalah "pembohong" (agak) dapat diandalkan. Dalam skenario paling ekstrem, ketikaq=0, ini berarti pintu yang menurut Monty punya mobil sebenarnya pasti kambing. Namun, perlu diketahui bahwa dua pintu yang tersisa masih dapat memiliki mobil atau kambing.

p(C=2|M)p(C=1|M)=0.750.75q1.513=1.51.5q
1.5q<0.5q<13q=0q=1

q>13

Ruben van Bergen
sumber
Bukankah nilai yang diharapkan benar-benar naik kembali ketika q < 1/3, karena itu tidak memodelkan seberapa besar kemungkinan ia akurat, tetapi memodelkan seberapa besar kemungkinan ia salah? Ketika mendekati 0 itu berarti dia selalu berbohong jika dia bisa, dan kemenangan yang Anda harapkan akan kembali ke 2/3
Cireo
2
@Cireo Dia tidak akan berbohong, dia hanya akan salah. Berbohong akan menyiratkan dia mengetahui jawabannya salah. Saya menduga alasan mengapa nilai yang diharapkan tidak naik kembali adalah karena kemungkinan ia secara tidak sengaja menunjuk ke pintu dengan mobil di belakangnya (yaitu, p (M | C = 2) naik) dan Anda tidak dapat memilih pintu itu, tidak peduli apa). q = 0 berarti ia selalu salah mengingat di mana mobil itu berada, yaitu sekarang ada peluang yang relatif tinggi untuk menunjuk ke pintu dengan mobil di belakangnya.
Buurman
3
Solusi yang lebih umum (yang jelas dibutuhkan) termasuk Monty yang "bermusuhan"; orang yang mengubah apa yang dia tunjukkan (atau bahkan jika dia menunjuk sesuatu) tergantung pada apakah kamu memilih kambing atau mobil.
Yakk
3
@ Yakk: Ada lebih banyak skenario yang dapat Anda bayangkan yang mengubah peluang dalam banyak cara yang tak terbatas. Itu juga semua tergantung pada apakah Anda tahu bagaimana Monty beroperasi. Jika Anda tahu dia bermusuhan, maka sebenarnya dia tidak bisa mengurangi peluang Anda di bawah 1/3, karena Anda hanya akan memutuskan untuk mengabaikan apa pun yang dia lakukan. Jika Anda tidak tahu proses keputusannya, maka itu benar-benar tergantung pada apa yang Anda asumsikan dan apa yang dia lakukan dengan tepat, dan ada banyak derajat kebebasan di sana.
Ruben van Bergen
1
q=0
7

Ini seharusnya merupakan variasi masalah yang cukup sederhana (meskipun saya perhatikan latar belakang matematika Anda yang terbatas, jadi saya kira itu relatif). Saya akan menyarankan Anda pertama kali mencoba menentukan solusi yang tergantung pada apakah Monte itu sempurna, atau sepenuhnya salah. Kasus pertama hanyalah masalah Monte Hall yang biasa, jadi tidak perlu bekerja di sana. Dalam kasus kedua, Anda akan memperlakukan pintu yang ia pilih sebagai acak di semua pintu, termasuk pintu dengan hadiah (yaitu, ia mungkin masih memilih pintu tanpa hadiah, tetapi ini sekarang acak). Jika Anda dapat menghitung probabilitas menang dalam masing-masing kasus ini, maka Anda menggunakan hukum probabilitas total untuk menentukan probabilitas kemenangan yang relevan dalam kasus di mana Monte memiliki beberapa tingkat fallibilitas tertentu (ditentukan oleh probabilitas bahwa kita tidak dapat salah dibandingkan sepenuhnya bisa salah).

Pasang kembali Monica
sumber
2
Saya menghargai tanggapannya, tetapi saya mencari sesuatu yang lebih spesifik. Saya menetapkan bahwa Monty telah memilih Pintu. Saya menetapkan bahwa kemungkinan Hadiah berada di balik pintu itu bisa dari nol hingga 100%. Saya berharap untuk formula yang akan memungkinkan saya untuk hanya memasukkan Probabilitas bahwa Monty Benar / Salah dan kemudian mengerjakan sisa rumus akan memberikan Perkiraan Numerik yang menunjukkan Probabilitas bahwa Switching akan menghasilkan Kemenangan. Apakah tingkat bantuan itu permintaan yang tidak realistis?
Pseudoego
4

Berdasarkan komentar pada jawaban Ben, saya akan menawarkan dua interpretasi berbeda dari varian Monty Hall ini, berbeda dengan Ruben van Bergen.

Yang pertama saya akan memanggil Liar Monty dan yang kedua Tidak Dapat Dipercaya Monty. Dalam kedua versi masalah muncul sebagai berikut:

(0) Ada tiga pintu, di belakang salah satunya adalah mobil dan di belakang dua lainnya adalah kambing, didistribusikan secara acak.

(1) Kontestan memilih pintu secara acak.

(2) Monty mengambil pintu yang berbeda dari pintu kontestan dan mengklaim seekor kambing ada di belakangnya.

(3) Kontestan ditawari untuk beralih ke pintu ketiga yang tidak dipetik, dan masalahnya adalah "Kapan kontestan harus beralih untuk memaksimalkan kemungkinan menemukan mobil di belakang pintu?"

Dalam Liar Monty, pada langkah (2), jika kontestan telah memilih pintu yang berisi seekor kambing, maka Monty mengambil pintu yang berisi mobil dengan beberapa probabilitas yang telah ditentukan (yaitu ada kemungkinan antara 0 dan 100% bahwa ia akan berbohong bahwa kambing ada di belakang pintu). Perhatikan bahwa dalam varian ini, Monty tidak pernah mengambil pintu yang berisi mobil (yaitu tidak dapat berbohong) jika kontestan memilih mobil pada langkah (1).

2313

Untuk menjawab masalah ini, kita harus menggunakan beberapa persamaan. Saya akan mencoba dan mengucapkan jawaban saya sehingga dapat diakses. Dua hal yang saya harap tidak terlalu membingungkan adalah manipulasi aljabar simbol, dan probabilitas bersyarat. Untuk yang pertama, kami akan menggunakan simbol untuk menunjukkan yang berikut:

S=The car is behind the door the contestant can switch to.S¯=The car is not behind the door the contestant can switch to.M=The car is behind the door Monty chose.M¯=The car is not behind the door Monty chose.C=The car is behind the door the contestant chose in step (1).C¯=The car is not behind the door the contestant chose in step (1).

Pr()Pr(M¯)

Pr(S|M¯)|Pr(S|M¯)Pr(S|M¯)=23Pr(S)=13

Pr(M|C¯)Pr(M) Pr(M and C¯)=Pr(C¯|M)Pr(M)=Pr(M|C¯)Pr(C¯)

Pr(M)=Pr(M|C¯)Pr(C¯)Pr(C¯|M)32Pr(M)=Pr(M|C¯),
Pr(C¯)23Pr(C¯|M)

23

Pr(S)

Pr(S)=Pr(S|C)Pr(C)+Pr(S|C¯ and M)Pr(C¯ and M)+Pr(S|C¯ and M¯)Pr(C¯ and M¯)=Pr(C¯ and M¯)
Pr(S|C)=Pr(S|C¯ and M)=0Pr(S|C¯ and M¯)=1

Melanjutkan:

Pr(S)=Pr(C¯ and M¯)=Pr(M¯|C¯)Pr(C¯)=2323Pr(M|C¯))

Pr(M|C¯))=1Pr(S)23

Dari sini, Anda dapat menyusun strategi optimal untuk Liar, dan Monty yang Tidak Dapat Diandalkan.

Adendum 1

Menanggapi komentar (penekanan saya):

"Saya menambahkan rincian lebih lanjut dalam komentar saya ke @alex - Monty tidak pernah bermusuhan atau licik, hanya FALLIBLE, karena kadang-kadang ia bisa salah karena alasan apa pun, dan tidak pernah benar-benar membuka pintu. Penelitian menunjukkan bahwa Monty salah kira-kira 33,3% dari waktu, dan mobil benar-benar ternyata ada di sana. Itu adalah Kemungkinan Posterior menjadi benar 66,6% dari waktu, benar? Monty tidak pernah memilih pintu ANDA, dan Anda tidak akan pernah memilihnya . Apakah asumsi ini mengubah apa pun? "

Ini seperti yang saya mengerti, Soal Monty Hall yang Tidak Dapat Dipercaya diperkenalkan di awal jawaban saya.

13

Pr(S)=2323Pr(M|C¯)=2323×32Pr(M)=2313=13

Dengan demikian, tidak ada perbedaan antara beralih, tetap dengan pintu asli atau jika diizinkan, beralih ke pintu yang dipilih Monty (sesuai dengan intuisi Anda.)

Alex
sumber
Alex dan @Ruben van Bergen et al. Terima kasih atas perinciannya. Asumsikan Monty tidak pernah bermusuhan, hanya bisa salah dan mengatakan kepada Anda, "Saya cukup yakin bahwa mobil TIDAK di balik pintu ini." tetapi tidak membuka pintu. Mari kita asumsikan bahwa penelitian menunjukkan dia SALAH hanya sekitar 33,3% dari waktu, sehingga benar 66,6% (Probabilitas Posterior?). Masih ada beberapa manfaat untuk beralih, tetapi begitu akurasinya hanya mencapai 33,3% maka tidak masuk akal untuk beralih ke pintu HIS atau yang lainnya. Secara harfiah kasus "tebakan Anda sama baiknya dengan tebakan saya." Apakah semua ini mengubah Analisis atau Rumus Anda?
Pseudoego
Tidak, ini tidak mengubah analisis saya. Saya menambahkan sesuatu yang saya harap akan mengklarifikasi pertanyaan dalam komentar Anda. Btw, saya tidak akan terlalu banyak membaca kata-kata "bermusuhan", "salah", "kebohongan monty". Ini tidak benar-benar berarti apa-apa kecuali didefinisikan dengan presisi sebagai probabilitas (bersyarat) bahwa Monty salah tentang pintu yang mengandung kambing.
Alex
Cukup kesal bahwa jawaban SENDIRI saya untuk pertanyaan SAYA SENDIRI akan dihapus dengan satu-satunya penjelasan yang diberikan adalah bahwa situs ini bukan untuk "diskusi" - ketika saya terutama menjelaskan mengapa saya pikir Jawaban yang diberikan sejauh ini adalah Benar, dan menjelaskan bagaimana mereka akan menjadi berguna. Ada jauh lebih banyak diskusi di sebagian besar jawaban lain yang diberikan. Ini tampaknya rabun bagi saya - paling baik - dan tolol - paling buruk - untuk menghapus jawaban seseorang untuk pertanyaan mereka sendiri: bagaimana Anda bisa menjelaskan MENGAPA Anda memberi peringkat sebagai Jawaban yang TERBAIK tanpa membahasnya? Terima kasih untuk semua yang menjawab terlepas.
Pseudoego
@Pseudoego komentar terakhir Anda lebih baik dikirim sebagai komentar pada pertanyaan awal Anda. Saya tidak melihat jawaban Anda, tetapi sepertinya Anda ingin mendiskusikan jawaban yang ada, dalam hal ini Anda dapat mengubah pertanyaan awal Anda.
Alex
0

Untuk beberapa alasan, seorang moderator memutuskan untuk menghapus jawaban saya sendiri untuk pertanyaan saya sendiri, dengan alasan bahwa itu berisi "diskusi." Saya tidak benar-benar melihat BAGAIMANA saya dapat menjelaskan apa yang merupakan Jawaban Terbaik tanpa membahas apa yang membuatnya bekerja untuk saya, dan bagaimana hal itu dapat diterapkan dalam praktik.

Saya menghargai wawasan dan formula yang disediakan dalam jawaban sebelumnya. Tampaknya JIKA "Fallible Monty" hanya 66% akurat dalam memprediksi tidak adanya Hadiah / Mobil KEMUDIAN ada manfaat NOL untuk beralih dari pintu pilihan awal Anda .... karena tingkat kesalahan 33% adalah default tarif dasar untuk Hadiah yang berada di balik pintu APA PUN. Satu mengasumsikan, bahwa JIKA Monty menjadi lebih baik dari 66% dalam memprediksi di mana TIDAK ADA HADIAH KEMUDIAN beralih memperoleh Utilitas yang lebih besar.

Pseudoego
sumber