Paradoks tahanan

11

Saya diberi latihan, dan saya tidak bisa mengetahuinya.

Paradox Tahanan

Tiga tahanan di sel isolasi, A, B dan C, telah dijatuhi hukuman mati pada hari yang sama tetapi, karena ada hari libur nasional, gubernur memutuskan bahwa seseorang akan diberikan grasi. Para tahanan diberitahu tentang hal ini tetapi diberitahu bahwa mereka tidak akan tahu yang mana dari mereka yang akan dibebaskan sampai hari yang dijadwalkan untuk eksekusi.

Tahanan A berkata kepada sipir penjara “Saya sudah tahu bahwa setidaknya satu dari dua tahanan lainnya akan dieksekusi, jadi jika Anda memberi tahu saya nama orang yang akan dieksekusi, Anda tidak akan memberi saya informasi tentang eksekusi saya sendiri” .

Penjara menerima ini dan mengatakan kepadanya bahwa C pasti akan mati.

A kemudian beralasan “Sebelum saya tahu C akan dieksekusi, saya punya peluang 1 banding 3 untuk menerima pengampunan. Sekarang saya tahu bahwa B atau saya sendiri akan diampuni peluang telah meningkat menjadi 1 banding 2. ”.

Tapi sipir penjara mengatakan, "Anda bisa mencapai kesimpulan yang sama jika saya mengatakan B akan mati, dan saya pasti akan menjawab B atau C, jadi mengapa Anda perlu bertanya?".

Bagaimana peluang A menerima pengampunan dan mengapa? Bangunlah sebuah penjelasan yang akan meyakinkan orang lain bahwa Anda benar.

Anda bisa mengatasi ini dengan teorema Bayes, dengan menggambar jaringan kepercayaan, atau dengan akal sehat. Pendekatan mana pun yang Anda pilih harus memperdalam pemahaman Anda tentang konsep probabilitas bersyarat yang tampak sederhana.

Inilah analisis saya:

Ini terlihat seperti masalah Monty Hall , tetapi tidak cukup. Jika A mengatakan I change my place with Bsetelah dia diberi tahu C akan mati, dia memiliki 2/3 peluang untuk diselamatkan. Jika tidak, maka saya akan mengatakan peluangnya adalah 1/3 untuk hidup, seperti ketika Anda tidak mengubah pilihan Anda dalam masalah Monty Hall. Tetapi pada saat yang sama, ia berada dalam kelompok 2 orang, dan seseorang harus mati, jadi tergoda untuk mengatakan bahwa peluangnya adalah 1/2.

Jadi paradoksnya masih ada di sini, bagaimana Anda akan mendekati ini. Juga, saya tidak tahu bagaimana saya bisa membuat jaringan kepercayaan tentang ini, jadi saya tertarik untuk melihatnya.

Benjamin Crouzier
sumber
2
"Dia dalam kelompok 2 orang" tidak menyiratkan "peluangnya adalah 1/2"
Henry

Jawaban:

8

Awalnya ada tiga kemungkinan dengan probabilitas yang sama:

  • A akan dibebaskan (prob )1/3
  • B akan dibebaskan (prob )1/3
  • C akan dibebaskan (prob )1/3

Dengan janji pesan, ada empat kemungkinan dengan probabilitas berbeda:

  • A akan dibebaskan dan A diberitahu B akan dieksekusi (prob )1/6
  • A akan dibebaskan dan A diberi tahu C akan dieksekusi (prob )1/6
  • B akan dibebaskan dan A diberi tahu C akan dieksekusi (prob )1/3
  • C akan dibebaskan dan A diberitahu B akan dieksekusi (prob )1/3

Bersyarat pada "A diberitahu C akan dieksekusi" ini menjadi

  • A akan dibebaskan dan A diberi tahu C akan dieksekusi (prob )1/3
  • B akan dibebaskan dan A diberi tahu C akan dieksekusi (prob )2/3

Jadi setelah pesan A ingin bertukar dengan B (masalah Monty Hall) tetapi tidak bisa dan dengan demikian menjaga kemungkinan asli dieksekusi.2/3

Henry
sumber
1
A ingin bertukar dengan B adalah kuncinya. Untuk mengambil salah satu penjelasan umum Monty Hall: Bayangkan ada 1000 tahanan: A meminta sipir yang memberinya 998 nama. Jelas kami baru saja belajar banyak tentang satu orang yang bukan A dan yang tidak bernama . Tapi kita tidak belajar apa-apa tentang A .
Ben Jackson
Saya pikir dalam posisi A itu strategi yang sangat baik baginya untuk bertanya kepada penjaga ini. Kemudian, bicara dengan B dan tanyakan apakah dia ingin pindah. Jika dia setuju, kalian bisa bertanya pada algojo apakah, jika salah satu dari mereka akan dibebaskan, maka bebaskan yang lain. Dari perspektif B, peluangnya tidak berubah, jadi tidak ada alasan baginya untuk mengatakan tidak (atau untuk mengatakan ya, jadi ini masalah tekanan pada saat itu)
Cruncher
8

Saya pikir Anda terlalu memikirkan masalahnya - ini adalah masalah Monty Hall dan logika yang sama berlaku.

babelproofreader
sumber
Bisakah kamu berkembang? Saya tertarik dengan alasannya, bukan jawabannya
Benjamin Crouzier
1
@pinouchon: Penjara adalah Monty Hall dan Tahanan A adalah pemainnya. Mati mirip dengan mendapatkan kambing; diampuni sama dengan mendapatkan hadiah. Sekarang Anda dapat langsung menerjemahkan penjelasan apa pun dari masalah Monty Hall yang Anda sukai: yang mencakup banyak alasan. +1 ke babelproofreader untuk menunjukkan ini.
whuber
Bagaimana Anda akan membantah pernyataan ini: But at the same time, he is in a group of 2 guys, and one should die, so it is tempting to say that his chances are 1/2.. Dan bagaimana dengan jaringan kepercayaan?
Benjamin Crouzier
1
@Pinouchon Akan sangat konstruktif untuk mengedit pertanyaan Anda untuk fokus pada aspek jaringan kepercayaan. Masalah Monty Hall sendiri telah dibahas sampai mati di banyak tempat, jadi saya tidak melihat gunanya mengulangi materi itu di sini.
whuber
Saya setuju bahwa masalah Monty Hall telah dibahas sampai mati tetapi meskipun ada pernyataan babelproof dan whuber, saya tidak melihat di mana Tahanan A dapat berpindah tempat. Jika sipir penjara memiliki tiga amplop tertutup, satu berisi pengampunan dan dua berisi hukuman mati, A mengambil satu amplop, dan sipir itu membuka yang lain (aturan yang sama persis seperti yang saya berikan dalam jawaban terpisah) dan menunjukkan bahwa itu berisi hukuman mati, dan lalu bertanya, "Apakah Anda ingin menyimpan amplop yang Anda pilih atau lebih suka beralih?" Saya bisa melihat analoginya
Dilip Sarwate
3

Saya tidak yakin bahwa saya setuju dengan @babelproofreader bahwa ini adalah masalah Monty Hall dan logika yang sama berlaku. Dalam masalah Monty Hall, Anda turun dan memilih satu pintu. Aturannya adalah bahwa Monty tahu di mana hadiahnya, tidak akan pernah membuka pintu yang menyembunyikan hadiahnya, dan akan selalu membuka salah satu pintu yang tidak dipilih (yaitu jika Anda telah memilih pintu tanpa hadiah, dia tidak akan membuka pintu yang Anda miliki memilih dan berkata, "Maaf, Anda kalah!" dan mengirim Anda kembali ke tempat duduk Anda), dan dia akan selalu menawarkan pilihan untuk beralih ke pintu lain (yang belum dibuka) (yaitu dia tidak akan menawarkan pilihan hanya ketika Anda telah memilih pintu dengan hadiah.) Dalam keadaan ini, jika menunjukkan peristiwa bahwa pilihan awal Anda adalah pintu dengan hadiah, maka . JikaAP(A)=13B adalah acara dimana pilihan terakhir Anda adalah pintu dengan hadiah, lalu

  • jika strategi Anda adalah selalu bertahan , maka (karena Anda membuat pilihan yang tepat di awal dan tetap menggunakannya) dan (karena Anda membuat pilihan yang salah di awal dan tetap dengan itu). Jadi dengan hukum probabilitas total, P(BA)=1P(BAc)=0
    P(B)=P(BA)P(A)+P(BAc)P(Ac)=1×13+0×23=13
  • jika strategi Anda adalah untuk selalu beralih , maka (karena Anda membuat pilihan yang tepat di awal dan kemudian beralih) dan (karena Anda membuat kesalahan pilihan di awal dan pintu yang tersisa (belum dipilih) dijamin untuk mendapatkan hadiah). Jadi dengan hukum probabilitas total, P(BA)=0P(BAc)=1
    P(B)=P(BA)P(A)+P(BAc)P(Ac)=0×13+1×23=23

Di sini situasinya berbeda. Tidak ada perubahan tempat dengan seperti pada "Jika A mengatakan saya mengubah tempat saya dengan B setelah dia diberi tahu C akan mati, dia memiliki 2/3 peluang untuk diselamatkan." B

Komentar tambahan: Perbedaan lain adalah bahwa A tidak memiliki informasi mengenai apakah sipir penjara tahu siapa yang akan diampuni atau apakah sipir penjara mengatakan kebenaran ketika dia mengatakan bahwa C akan dieksekusi. Di sisi lain, sipir itu benar ketika dia mengatakan bahwa perintahnya bahwa A akan dieksekusi tidak memberikan informasi yang berguna kepada A. Analogi terdekat dengan masalah Monty Hall adalah bahwa setelah A memilih pintu, Monty membuka pintu. pintu yang tidak dipilih untuk mengungkapkan seekor kambing dan berkata kepada A "Buka pintu Anda dan mari kita lihat apa yang Anda dapatkan", yaitu, tidak ada tawaran sakelar. Jadi peluang A untuk memenangkan hadiah (Monty Hall) atau diampuni (masalah tahanan) adalah sama: dari313 terlepas dari apakah Monty membuka pintu yang tidak dipilih untuk mengungkapkan seekor kambing atau tidak, atau sipir memberitahu A bahwa C akan dieksekusi, atau tidak, persis seperti yang Henry hitung secara terperinci.

Dilip Sarwate
sumber
Saya pikir kita dapat berasumsi bahwa sipir penjara memang memiliki informasi itu, jika tidak masalahnya tidak layak untuk dipikirkan (jika sipir penjara memiliki kemungkinan berbohong yang tidak diketahui, maka mereka mungkin juga tidak mengatakan apa-apa). Adapun poin pertama Anda: pasti, hasilnya berbeda dari pada masalah Monty Hall karena tidak ada opsi untuk beralih. Tetapi logikanya sama: dengan mengungkapkan satu opsi yang bukan pemenang, informasi diberikan tentang opsi lain yang bisa dipilih oleh kepala penjara / Monty.
Ruben van Bergen
2

Jawabannya tergantung pada bagaimana sipir penjara memilih tahanan mana yang akan disebutkan ketika dia tahu bahwa A akan diampuni. Pertimbangkan dua aturan:

1) Kepala penjara memilih antara B dan C secara acak, dan kebetulan mengatakan C dalam kasus ini. Maka peluang A untuk diampuni adalah 1/3.

2) Penjara selalu mengatakan C. Maka peluang A untuk diampuni adalah 1/2.

Yang kami diberitahu hanyalah sipir itu mengatakan C, jadi kami tidak tahu aturan mana yang ia ikuti. Bahkan, mungkin ada aturan lain - mungkin sipir menggulung mati dan hanya mengatakan C jika ia menggulung 6.

Ringold
sumber
0

Bayangkan sipir itu memberi tahu A bahwa C pasti akan mati. Dan kemudian dia memberi tahu B bahwa C pasti akan mati. Jelas dalam kasus ini bahwa A dan B masing-masing memiliki 50% untuk diampuni. Tetapi apa perbedaan antara kedua versi itu?

keberanian
sumber
0

Tiga tahanan masalah adalah berbeda dari Monty Hall. Probabilitas untuk diampuni sebenarnya adalah untuk Alice, bukan , tetapi hanya jika sipir penjara mengikuti strategi "selalu beri nama Bob bila mungkin".2 / 31/22/3

Acara: - Alice diampuni. Sama untuk dan . -jailer memberi tahu Alice nama "Bob" (sebagai jawaban untuk "siapa yang akan dieksekusi"). - dia memberi tahu nama "Carl". Dia tidak bisa menyebut nama Alice sendiri karena aturan.B C J J cABCJJc

Kami tertarik pada . Sekarang ada dua skenario:P(A|J)=P(J|A)P(A)/P(J)

  1. Penjara melemparkan koin sebelum memberi tahu B atau C: .P(J|A)=12

P(A|J)=12×13/12=13
  1. P(J|A)=1P(J|C)=1P(J|B)=0

P(J)=P(J|B)P(B)+P(J|Bc)P(Bc)=0×13+1×23=23

P(A|J)=1×13/23=12
Mikhail Volkhov
sumber
1
Bukankah "selalu beri nama Carl jika memungkinkan" sama masuk akalnya dengan "selalu beri nama Bob bila mungkin"?
Juho Kokkala
Ya, strategi S '= "selalu beri nama Carl jika mungkin" harus sepenuhnya sama jika kita mendefinisikan ulang J yang sesuai. Jika kita meninggalkan J apa adanya dan memaksa sipir untuk mengikuti S ', itu akan membuat segalanya ditentukan sebelumnya: setiap kali J (sipir berkata Bob), kita tahu bahwa tidak mungkin untuk mengatakan "Carl", jadi Carl diampuni .
Mikhail Volkhov
-1

Setelah menerima informasi, bahwa Tahanan C akan mati, peluangnya berubah menjadi 1/2, tetapi hanya, karena kemungkinan bahwa ia mendapatkan informasi itu sudah 2/3 (kemungkinan 1/3 tahanan C mendapatkan pengampunan dihapuskan) )

Dan 2/3 * 1/2 adalah probabilitas asli untuk dibebaskan.

Yang lebih meyakinkan adalah pendekatan oposisi:

Anggaplah, bahwa dia diberi tahu tahanan C akan mendapatkan pengampunan.
Apa peluangnya untuk tidak terbunuh?
Semua orang akan mengakui bahwa peluangnya nol, dengan asumsi sipir penjara tidak berbohong dan hanya ada satu pengampunan.

Kali ini, ia memiliki peluang 1/1, karena peluang untuk informasi itu sudah 1/3.

Sunzi
sumber
Ini tidak benar; lihat perhitungan dalam jawaban Henry yang menunjukkan bahwa setelah mendengar informasi sipir penjara, tahanan A memiliki peluang 2/3 untuk mati (bukan 1/2). Ini adalah probabilitas yang sama yang dia miliki sebelumnya, jadi sipir penjara itu benar: apa yang dia katakan kepada A tidak mengubah apa pun untuk peluang hidup A. Jika B mendengarkan, dia sekarang tahu bahwa kesempatan kematiannya berkurang menjadi 1/3.
Ruben van Bergen