Tawaran Acak Optimal

7

Pertanyaan ini berasal dari situs web ini yang sering saya teliti.

Dua pemain pergi ke acara permainan baru yang panas yang disebut "Kemenangan Angka Tinggi." Keduanya masuk ke bilik terpisah, dan masing-masing menekan tombol, dan angka acak antara nol dan satu muncul di layar. (Pada titik ini, tidak ada yang tahu nomor yang lain, tetapi mereka tahu nomor tersebut dipilih dari distribusi seragam standar.) Mereka dapat memilih untuk menyimpan nomor pertama, atau menekan tombol lagi untuk membuang nomor pertama dan mendapatkan yang kedua nomor acak, yang harus mereka pertahankan. Kemudian, mereka keluar dari stan mereka dan melihat angka terakhir untuk setiap pemain di dinding. Hadiah utama mewah - sebuah kasus penuh emas batangan - diberikan kepada pemain yang mempertahankan jumlah yang lebih tinggi. Nomor mana yang merupakan cutoff optimal bagi pemain untuk membuang nomor pertama mereka dan memilih yang lain? Dengan kata lain, dalam rentang mana mereka harus memilih untuk menyimpan nomor pertama,

Ini bisa merupakan masalah pelelangan yang sangat aneh dengan pemain simetris (saya juga menganggap para pemain netral risiko) atau permainan lotere / teori permainan yang sangat aneh.

Bagaimana Anda mendekati pertanyaan ini secara matematis dan jawaban apa yang Anda dapatkan untuk itu? Tidak ada hadiah bagi saya untuk mendapatkan jawaban yang tepat untuk teka-teki situs, saya hanya ingin tahu. Intuisi saya memberi tahu saya bahwa cutoff optimal adalah 0,5, karena Anda memiliki peluang 50-50 untuk menjadi lebih tinggi atau lebih rendah dari jumlah lawan Anda, terlepas dari apakah ia mencabut nomor acak mereka atau tidak, tetapi saya tidak yakin.

Kavaleri Kitsune
sumber
Saya tidak berpikir netralitas risiko ada hubungannya dengan ini, pemain hanya mencoba memaksimalkan probabilitas mereka untuk menang. Imbalannya adalah biner, tidak ada hasil rata-rata yang aman.
Giskard
@denesp Anda bisa menolak risiko dalam arti bahwa jika Anda menggambar katakan 0,46, Anda mungkin tidak ingin menggambar kembali meskipun Anda memiliki peluang lebih baik untuk mendapatkan nomor yang lebih baik daripada yang lebih buruk.
Kitsune Cavalry
1
@KitsuneCavalry Saya melihat apa yang Anda katakan, tapi itu akan menjadi beberapa "perilaku" gagasan penghindaran risiko, karena itu didefinisikan lebih dari langkah sementara daripada hasil akhir.
Shane
@Shane Tentu, saya dengar ya. Dan saya tidak terlalu khawatir tentang hal itu.
Kitsune Cavalry

Jawaban:

6

Pertama, saya hanya akan menunjukkan bahwa titik batas 0,5 (atau ) tidak berfungsi sebagai keseimbangan simetris, maka Anda dapat memutuskan sendiri apakah Anda ingin memikirkan masalah atau membaca jawaban lengkapnya .12

Mari kita tunjukkan titik cut-off oleh . Misalkan kedua pemain menggunakan strategi . Mari kita menunjukkan jumlah pemain dan masing-masing dengan dan dan angka potensial kedua mereka dengan dan . Misalkan . Dengan mempertahankan ini, probabilitas bahwa pemain menang adalah Ini juga berarti bahwa adalahcx,cyc=12xyx1y1x2y2x1=23x

P(12y1<23)+P(y1<12)P(y2<23)=16+1223=12.
23median dari distribusi ini .

Sekarang anggaplah . Dengan mempertahankan ini, probabilitas bahwa pemain menang adalah Tetapi jika ia akan membuang ia memiliki probabilitas untuk menang. jadi menjaga (dan sekitarnya) tidak optimal sehingga tidak bisa menjadi langkah keseimbangan.x1=12x

P(y1<12)P(y2<12)=1212=14
x1=12
P(y1<12)P(x2>y2)+P(y112)P(x2>y1)=38
38>14x1=12


ALERT SPOILER

Jika pemain memiliki cut-off dan pemain menarik dan mempertahankannya probabilitas bahwa pemain menang adalah Jika pemain tempat membuang probabilitas bahwa ia menang adalah Misalkan ada simetris kesetimbangan, yaitu . (Saya tidak berpikir keseimbangan lain ada tetapi saya tidak membuktikannya.)ycyxx1=cyx

P(y1<cy)P(y2<cy)=cycy=cy2.
xx1
P(y1cy)P(x2>y1)+P(y1<cy)P(x2>y2)=(1cy)(11+cy2)+cy12
cx=cy=cx1cx1=cx1P(y1<c)P(y2<c)

Karena probabilitas menang adalah kontinu dalam nilai , nilai cut-off sedemikian rupa sehingga jika maka probabilitas menang sama ketika disimpan dan ketika dibuang. Ini berarti x1cx1=cx1
P(y1<c)P(y2<c)=P(y1c)P(x2>y1)+P(y1<c)P(x2>y2)cc=(1c)(11+c2)+c12c2=12c+c22+c212c2+c212=0c=512.

Giskard
sumber
Seseorang melakukan derivasi yang sama dengan Anda, dan melakukan perhitungan Wolfram ini untuk mengeceknya: tinyurl.com/j9xey5t Jadi saya akan melanjutkan dan mengatakan ini terlihat benar. Sekarang jika Anda memecahkan bentuk umum dari permainan ini, saya akan memberikan jawaban terbaik: P Kidding ~ (Meskipun akan menarik untuk melihat bagaimana permainan berubah dengan lebih banyak kesempatan untuk reroll.) Apakah cutoff Anda yang diedit berarti kedua pemain memiliki 50 % menang, atau apakah Anda masih berpikir ada kesalahan dalam jawaban Anda?
Kitsune Cavalry
@KitsuneCavalry Saya pikir menerima itu sedikit prematur tapi untungnya perhitungannya benar dan alasan saya tentang 50% salah. Cut-off sangat tinggi sehingga menggambar itu 'beruntung' dan dengan demikian Anda memiliki peluang lebih baik dari 50% untuk menang jika Anda menariknya. Sebelum pengundian, Anda memiliki tepat 50%.
Giskard
Jika itu dihitung untuk apa pun, situs yang memberikan pertanyaan memberikan jawaban. Anda mendapatkannya dari uang. Merasa seperti pemenang hari ini. Anda mendapatkannya B)
Kitsune Cavalry
2

Misalkan orang 1 memilih cutoff dan orang 2 memilih cutoff , dengan . Misalkan menjadi probabilitas bahwa angka akhir orang 1 tidak lebih besar dari . sama dengan jika dan sebaliknya. Tetapkan cara yang sama. Sekarang plot terhadap pada plot parametrik untuk . Hasilnya adalah tiga segmen garis:c1c2c2c1p1(x)xp1(x)c1xx<c1c1x+xc1p2(x)p2(x)p1(x)0x1

  • Satu dari hingga , sesuai dengan ;(0,0)(c12,c1c2)0xc1
  • Satu dari hingga , sesuai dengan ;(c12,c1c2)(c1c2+c2c1,c22)c1xc2
  • Satu dari hingga , sesuai dengan .(c1c2+c2c1,c22)(1,1)c2x1

Tiga segmen garis ini membagi unit persegi menjadi dua bagian. Area bagian di bawah grafik adalah probabilitas bahwa orang 1 memiliki angka yang lebih tinggi. Beberapa geometri menunjukkan bahwa area ini adalah . Agar ada keseimbangan yang stabil, kedua turunan parsial ini harus nol, yaitu12+12(c2c1)(c1c2+c21)

1c22c1c2+c22=01c1+2c2c12+2c1c2=0

Menambahkan persamaan menunjukkan bahwa , yang hanya mungkin jika . Mengganti kembali ke salah satu persamaan, , jadi satu-satunya keseimbangan yang stabil adalah pada .c 1 = c(c2c1)(1+c1+c2)=0 1 - c 1 - c 2 1 = 0 c 1 = c 2 = c1=c21c1c12=0c1=c2=512

f ''
sumber
Ini adalah jawaban yang bagus tetapi mengapa Anda menyebut keseimbangan itu keseimbangan stabil?
Giskard
1
@denesp Saya kira itu berlebihan.
f ''