Taruhan Blackwell

12

Saya telah membaca tentang paradoks taruhan Blackwell di lemari Futility . Berikut ringkasannya: Anda disajikan dua amplop, dan . Amplop berisi jumlah uang acak, tetapi Anda tidak tahu apa-apa tentang distribusi tentang uang itu. Anda membuka satu, memeriksa berapa banyak uang di sana ( ), dan harus memilih: ambil amplop atau ?E y x E x E yExEyxExEy

Futility Closet merujuk pada seorang ahli matematika bernama Leonard Wapner: "Tanpa diduga, ada sesuatu yang dapat Anda lakukan, selain membuka amplop lainnya, untuk memberi diri Anda kesempatan yang lebih baik daripada bahkan menyelesaikannya dengan benar."

Idenya, yang tampaknya salah bagi saya, adalah sebagai berikut: pilih nomor acak . Jika , ambil . Jika , pilih .d < xdd<x d > x E yExd>xEy

Wapner: “Jika d jatuh antara x dan y maka prediksi Anda (seperti yang ditunjukkan oleh d) dijamin benar. Asumsikan ini terjadi dengan probabilitas p. Jika d jatuh kurang dari x dan y, maka prediksi Anda hanya akan benar jika angka yang Anda pilih x lebih besar dari keduanya. Ada kemungkinan 50 persen dari ini. Demikian pula, jika d lebih besar dari kedua angka, prediksi Anda akan benar hanya jika nomor yang Anda pilih lebih kecil dari keduanya. Ini terjadi dengan probabilitas 50 persen juga. ”

Jika probabilitas bahwa ada di lebih besar dari nol, maka keberhasilan rata-rata dari metode ini adalah . Ini berarti bahwa dengan mengamati variabel acak yang tidak terkait memberi kita informasi tambahan.[ x , y ] 1d[x,y]12+p2

Saya pikir ini semua salah, dan masalahnya terletak pada memilih angka -integer- acak. Apa artinya? Seperti, bilangan bulat apa saja? Dalam hal itu, probabilitas yang terletak di antara dan adalah nol, karena dan adalah terbatas.d x y x ypdxyxy

Jika kita mengatakan bahwa ada batasan jumlah uang maksimal, katakan , atau paling tidak kita pilih d dari , maka resepnya adalah saran sepele untuk memilih jika dan memilih jika .1 ... M E y x < M / 2 E x x > M / 2M1...MEyx<M/2Exx>M/2

Apakah saya melewatkan sesuatu di sini?

EDIT

OK, sekarang saya mulai melihat dari mana paradoks yang nampak berasal. Bagi saya tidak mungkin bahwa variabel acak yang tidak terkait dapat memberikan informasi tambahan.

Namun, perhatikan bahwa kita perlu secara sadar memilih distribusi d . Misalnya, pilih batas untuk distribusi yang seragam, atau dari distribusi Poissionian dll. Jelas, jika kita bermain untuk kacang, dan kami memilih distribusi d untuk menjadi seragam pada dolar, . Probabilitas terakhir ini akan bergantung pertama dan terutama pada penilaian kita tentang apa yang bisa ada dalam amplop.[ 10 9 , 2 10 9 ] P ( d ( x , y ) ) = 0λ[109,2109]P(d(x,y))=0

Dengan kata lain, jika teknik itu bekerja, maka asumsi bahwa kita tidak tahu apa distribusi uang dalam amplop (bagaimana jumlah uang untuk amplop itu dipilih) dilanggar. Namun, jika kita benar-benar tidak tahu apa yang ada dalam amplop, maka dalam skenario terburuk, kita tidak kehilangan apa pun dengan menerapkannya.

EDIT 2

Pikiran lain. Dengan , mari kita pilih, untuk menggambar , distribusi non-negatif terus menerus sehingga . Kami diizinkan melakukan itu, apakah saya benar? Kami melanjutkan seperti yang diperintahkan - jika , kami menyimpan amplop, jika , kami mengubah amplop. Alasannya tidak berubah, tergantung bagaimana kita memilih distribusi, bisa jadi (atau apakah saya salah?).d P ( d < x ) = P ( d > x ) d < x d > x P ( d [ x , y ] ) > 0xdP(d<x)=P(d>x)d<xd>xP(d[x,y])>0

Namun, mengingat bagaimana kami memilih distribusi, apa yang kami lakukan sekarang setara dengan lemparan koin. Kami melemparkan koin, dan jika itu adalah kepala, kami mengganti amplop, jika itu ekor, kami menempel pada amplop yang kami pegang. Dimana saya salah

EDIT 3 :

Oke, saya mengerti sekarang. Jika kita mendasarkan fungsi probabilitas dari pada (misalnya, kita mengambil sampel dari distribusi seragam dalam rentang , maka probabilitas tidak independen dari .x d ( 1 , 2 x ) P ( d ( x , y ) ) P ( keputusan yang benar | d ( x , y ) )dxd(1,2x)P(d(x,y))P(correct decision|d(x,y))

Jadi, jika (dengan probabilitas ), tebakannya selalu benar, seperti sebelumnya. Namun, jika adalah angka yang lebih rendah, dan , maka memiliki peluang lebih tinggi untuk lebih rendah daripada daripada lebih tinggi dari , jadi kami bias terhadap keputusan yang salah. Alasan yang sama berlaku ketika lebih tinggi dari dua angka.p x d ( x , y ) d x x xd(x,y)pxd(x,y)dxxx

Itu berarti bahwa kita harus memilih proses menggambar secara independen dari . Dengan kata lain, kita perlu membuat perkiraan tentang parameter distribusi dari mana dan diambil; Yang terburuk yang terjadi adalah kita masih menebak secara acak, tetapi yang paling baik yang terjadi adalah dugaan kita benar - dan kemudian kita mendapat keuntungan. Bagaimana ini seharusnya lebih baik daripada menebak "x dan y akan, saya pikir, setidaknya $ 1 , tetapi paling banyak $ 10 , jadi jika , kita menyimpannya, dan jika tidak, kita menukarnya" Saya belum Lihat.x x y x > 5dxxyx>5

Saya disesatkan oleh rumusan pop-sci tentang masalah dalam buku Wapner ( Ekspektasi Tak Terduga: Keingintahuan Bola Kristal Matematika ), yang menyatakan

"Dengan cara apa pun, pilih bilangan bulat positif acak" (Wapner menyarankan distribusi geometris - melempar koin sampai kepala pertama muncul, mengulangi proses jika ) "Jika menebak lebih tinggi dan jika tebak lebih rendah. (...) Anda akan menebak dengan benar lebih dari 50 persen dari waktu karena menunjuk dengan benar lebih dari 50 persen dari waktu! "d > x d < x dd=xd>xd<xd

Januari
sumber
1
Sangat terkait erat: stats.stackexchange.com/questions/95694
whuber
2
Ini sangat berbeda dari masalah dua amplop dalam arti bahwa: (1) argumen yang diberikan untuk beralih dalam masalah dua-amplop itu keliru, cacat dalam argumen dapat dilihat dengan menambahkan Bayesian sebelumnya sementara (2) argumen diberikan oleh Wapner untuk taruhan Blackwell benar.
Matthew Gunn
Jika jumlah uang di dalam amplop adalah elemen sewenang-wenang dari sekumpulan angka S, syarat yang memadai dan diperlukan agar strategi Wapner bekerja adalah untuk CDF dari angka yang Anda pilih untuk benar-benar meningkat di S.
Reinstate Monica
OK, saya masih kehilangan sesuatu - silakan lihat EDIT 2 saya, tetapi bagi saya sepertinya kita hanya bisa melempar koin dan masih harus bekerja, sesuai dengan alasannya. Dimana saya salah
Januari

Jawaban:

8

Ini lebih dikenal sebagai masalah dua-amplop . Paling umum jumlahnya diberikan sebagai dan tetapi tidak diharuskan bahwa ini menjadi masalahnya.2 AA2A

Beberapa poin:

  1. Anda tidak dapat memilih integer acak seragam *, tetapi bagian yang dikutip tampaknya tidak mengharuskannya seragam. Pilih distribusi - tidak masalah apa argumennya - asalkan memiliki probabilitas melebihi nilai terbatas apa pun.

  2. Tidak masuk akal untuk memilih bilangan bulat dengan aturan keputusan yang dikutip, karena uang adalah diskrit yang berarti ada peluang bukan nol dan tidak ada yang terdaftar untuk kasus itu. (Atau sebagai alternatif, untuk mengubah aturan untuk menentukan apa yang harus dilakukan ketika mereka sama)d = xd d=x

  3. Mengesampingkan hal itu, Anda dapat memilih dari beberapa distribusi berkelanjutan non-negatif - maka kita tidak perlu khawatir tentang kesetaraan.d

* (Anda juga tidak dapat memilih bilangan bulat non-negatif acak seragam atau bilangan bulat positif acak seragam)


Jika kita mengatakan bahwa ada batasan jumlah uang maksimal, katakan , atau paling tidak kita pilih dari , maka resepnya adalah saran sepele untuk memilih jika dan memilih jikad 1 ... M E y x < M / 2 E x x > M / 2Md1...MEyx<M/2Exx>M/2

Jika ternyata distribusi acak dari mana dipilih meliputi ini harus bekerja (memberi Anda lebih baik dari 50-50); jika distribusi macet di setengah itu tidak akan.M / 2xM/2

Namun, versi game ini yang pertama kali saya sajikan adalah bahwa amplop tersebut disajikan oleh seseorang yang (mungkin) berupaya meminimalkan penghasilan Anda dari game. Strategi menggunakan distribusi untuk memutuskan apakah akan beralih ke amplop lain masih akan berfungsi dalam contoh itu.

Glen_b -Reinstate Monica
sumber
OK, poin (1-3) diambil. Jadi, saya diizinkan memilih distribusi acak yang terus menerus, tidak negatif, dan sehingga benar? Tetapi kemudian keputusan itu pada dasarnya didasarkan pada lemparan koin ... apakah saya salah? dP(d<x)=P(d>x)
Januari
Anda tidak memerlukan sama sekali. Anda hanya perlu beberapa probabilitas nol untuk mendapatkan di antara kedua jumlah tersebut. P(d<x)=P(d>x)
Glen_b -Reinstate Monica
Ya, tapi saya diizinkan mendefinisikan fungsi kerapatan untuk seperti yang saya inginkan, bukan? Saya melakukan itu untuk mengarahkan argumen ke kesimpulan yang tidak masuk akal. d
Januari
dengan membuat strategi Anda fungsi x Anda tidak memberi diri Anda keuntungan membuat pilihan yang benar ketika d berada di antara x dan y - Anda menentukan jalan keluar dari memenangkan permainan. Jika tautan yang Anda berikan mengklaim bahwa strategi seperti itu akan berhasil, mereka akan salah
Glen_b -Reinstate Monica
Apa, dalam penalaran Wapner, melarang saya untuk mendefinisikan fungsi probabilitas yang digunakan untuk memperoleh sebagai fungsi ? Selama , maka alasannya tetap bekerja, apakah saya salah? Jika saya menggunakan distribusi kontinu, non-negatif yang mencakup (mis. Distribusi seragam pada , maka saya dijamin bahwa ini adalah masalahnya. Dan saya masih membuat keputusan yang benar jika .dxP(d(x,y))>0x(1,2x)d(x,y)
Januari
7

Argumen Wapner benar!

Beberapa komentar:

  • Mengikuti strategi cut-off yang dijelaskan di mana kami beralih amplop jika paling buruk tidak berguna dalam harapan ex-ante. Dengan pilihan , ini bisa sangat berguna.x<dd
  • Jika Anda menambahkan Bayesian prior (yaitu Anda menambahkan keyakinan tentang distribusi awal uang dalam amplop), Anda dapat menyelesaikan untuk nilai optimal mengingat keyakinan sebelumnya Anda.d
  • Dalam situasi tertentu (mis. Di mana semakin Anda amati, semakin besar kemungkinan Anda mendapatkan amplop besar), strategi cut-off bahkan lebih optimal.
  • Dalam pengaturan Bayesian yang lebih umum, Anda dapat melakukan lebih baik daripada strategi cutoff sederhana untuk banyak prior.

Masalah terkait tetapi berbeda:

Seperti yang disebutkan oleh beberapa @Glen_b dan @whuber, ada teka-teki terkait yang dikenal sebagai Two Envelope Problem di mana argumen yang keliru diberikan untuk selalu berganti amplop dan cacat dalam argumen dapat dilihat dengan mengambil pendekatan Bayesian dan menambahkan keyakinan sebelumnya atas masalah tersebut. isi kedua amplop.

Dalam beberapa hal, teka-teki yang dijelaskan di sini agak berbeda. Argumen Wapner benar!

Matthew Gunn
sumber
1
OK, sekarang saya melihat dari mana paradoks itu berasal. Atau, secara spesifik, di mana informasi tambahan mengalir ke sistem. Dengan secara sadar memilih distribusi d , kita menggunakan pengetahuan a priori kita tentang di mana, lebih atau kurang, jumlah uang di kedua amplop itu seharusnya. Skenario terburuk, pengetahuan kita tidak berguna, tetapi metode ini menjamin bahwa kita tidak akan dirugikan jika menggunakannya.
Januari
Setelah beberapa pemikiran, saya masih tidak mengerti - lihat EDIT 2.
Januari
Skenario (A) Bayangkan amplop kecil memiliki dan amplop besar memiliki . Mari kita pilih = 15. . Aturan keputusan akan mengarahkan Anda ke pilihan yang benar 100% dari waktu! 20 d P ( x < d ) = P ( x > d )1020dP(x<d)=P(x>d)
Matthew Gunn
Sekarang mari kita periksa beberapa Skenario (B). Bayangkan amplop kecil memiliki jumlah dolar ganjil dari 1 hingga 9 (mis. 1 atau 3 atau 5 atau 7 atau 9) dan amplop besar memiliki 1 dolar lebih. Pilih dan kemudian . Namun di sini, repick Anda jika aturan keputusan tidak membantu! Ini mengarah ke keputusan yang tepat jika atau dan keputusan yang salah jika . Ingatlah pasangan yang mungkin adalah (1,2), (3, 4), (5, 6), (7, 8) (9, 10) $ Hal BAYESIAN OPTIMAL untuk mengetahui mengetahui distribusi awal ini dicabut jika Anda melihat jumlah uang ganjil. P ( x < d ) = P ( x > d ) < 5,5 x = 1 , 3 , 5 , 6 , 8 , 10 x = 2 , 4 , 7 , 9d=5.5P(x<d)=P(x>d)<5.5x=1,3,5,6,8,10x=2,4,7,9
Matthew Gunn
Kami tidak tahu distribusi dan , jadi kami tidak bisa mengambilnya dengan cara yang Anda usulkan. Setelah kami membuka amplop, kami tahu , tetapi kami tidak tahu bahwa itu dipilih secara acak dari bilangan bulat 1 hingga 9, dan dengan demikian kita tidak dapat memilih menjadi 5,5. Seperti disebutkan oleh @Glen_b di atas, harus dipilih dari distribusi kontinu yang tidak negatif. y x d dxyxdd
Januari
0

Saya tertarik dengan ini dan mengambil pendekatan pragmatis bermain dengannya di Excel.

Saya menghasilkan tiga angka acak untuk x, y, dan d dalam kisaran 1-100. Saya kemudian melakukan perbandingan antara d dan x dan antara x dan y dan melihat hasilnya, benar atau salah.

Saya melakukan ini 500 kali dan mengulanginya beberapa kali dan secara teratur mendapatkan jawaban yang tepat dari 330 dari 500, seperti yang diperkirakan.

Saya kemudian meningkatkan kisaran d menjadi 1-10000 dan jawaban yang benar turun menjadi sekitar 260 untuk 500 berjalan.

Jadi ya, pemilihan d tergantung pada nilai yang diharapkan dari x dan y.

BoB

pengguna121909
sumber
0

Saya pikir paradoks yang terlihat dengan perluasan Wapner dari persamaan p + (1-p) / 2 adalah bahwa ia mengasumsikan bahwa (1-p) / 2> 0. Untuk banyak rentang d nilai ini adalah 0.

Sebagai contoh: setiap d dipilih dari distribusi simetris berpusat pada nilai dalam amplop terbuka, memberikan kemungkinan salah 1/2 dan benar 1/2.

Distribusi apa pun yang dipilih secara asimetris tampaknya memihak pilihan dengan cara yang salah 1/2 kali.

Jadi apakah ada cara untuk memilih rentang dan distribusi untuk d sehingga persamaan ini berlaku?

Terry
sumber