Saya telah membaca tentang paradoks taruhan Blackwell di lemari Futility . Berikut ringkasannya: Anda disajikan dua amplop, dan . Amplop berisi jumlah uang acak, tetapi Anda tidak tahu apa-apa tentang distribusi tentang uang itu. Anda membuka satu, memeriksa berapa banyak uang di sana ( ), dan harus memilih: ambil amplop atau ?E y x E x E y
Futility Closet merujuk pada seorang ahli matematika bernama Leonard Wapner: "Tanpa diduga, ada sesuatu yang dapat Anda lakukan, selain membuka amplop lainnya, untuk memberi diri Anda kesempatan yang lebih baik daripada bahkan menyelesaikannya dengan benar."
Idenya, yang tampaknya salah bagi saya, adalah sebagai berikut: pilih nomor acak . Jika , ambil . Jika , pilih .d < x d > x E y
Wapner: “Jika d jatuh antara x dan y maka prediksi Anda (seperti yang ditunjukkan oleh d) dijamin benar. Asumsikan ini terjadi dengan probabilitas p. Jika d jatuh kurang dari x dan y, maka prediksi Anda hanya akan benar jika angka yang Anda pilih x lebih besar dari keduanya. Ada kemungkinan 50 persen dari ini. Demikian pula, jika d lebih besar dari kedua angka, prediksi Anda akan benar hanya jika nomor yang Anda pilih lebih kecil dari keduanya. Ini terjadi dengan probabilitas 50 persen juga. ”
Jika probabilitas bahwa ada di lebih besar dari nol, maka keberhasilan rata-rata dari metode ini adalah . Ini berarti bahwa dengan mengamati variabel acak yang tidak terkait memberi kita informasi tambahan.[ x , y ] 1
Saya pikir ini semua salah, dan masalahnya terletak pada memilih angka -integer- acak. Apa artinya? Seperti, bilangan bulat apa saja? Dalam hal itu, probabilitas yang terletak di antara dan adalah nol, karena dan adalah terbatas.d x y x y
Jika kita mengatakan bahwa ada batasan jumlah uang maksimal, katakan , atau paling tidak kita pilih d dari , maka resepnya adalah saran sepele untuk memilih jika dan memilih jika .1 ... M E y x < M / 2 E x x > M / 2
Apakah saya melewatkan sesuatu di sini?
EDIT
OK, sekarang saya mulai melihat dari mana paradoks yang nampak berasal. Bagi saya tidak mungkin bahwa variabel acak yang tidak terkait dapat memberikan informasi tambahan.
Namun, perhatikan bahwa kita perlu secara sadar memilih distribusi d . Misalnya, pilih batas untuk distribusi yang seragam, atau dari distribusi Poissionian dll. Jelas, jika kita bermain untuk kacang, dan kami memilih distribusi d untuk menjadi seragam pada dolar, . Probabilitas terakhir ini akan bergantung pertama dan terutama pada penilaian kita tentang apa yang bisa ada dalam amplop.[ 10 9 , 2 ⋅ 10 9 ] P ( d ∈ ( x , y ) ) = 0
Dengan kata lain, jika teknik itu bekerja, maka asumsi bahwa kita tidak tahu apa distribusi uang dalam amplop (bagaimana jumlah uang untuk amplop itu dipilih) dilanggar. Namun, jika kita benar-benar tidak tahu apa yang ada dalam amplop, maka dalam skenario terburuk, kita tidak kehilangan apa pun dengan menerapkannya.
EDIT 2
Pikiran lain. Dengan , mari kita pilih, untuk menggambar , distribusi non-negatif terus menerus sehingga . Kami diizinkan melakukan itu, apakah saya benar? Kami melanjutkan seperti yang diperintahkan - jika , kami menyimpan amplop, jika , kami mengubah amplop. Alasannya tidak berubah, tergantung bagaimana kita memilih distribusi, bisa jadi (atau apakah saya salah?).d P ( d < x ) = P ( d > x ) d < x d > x P ( d ∈ [ x , y ] ) > 0
Namun, mengingat bagaimana kami memilih distribusi, apa yang kami lakukan sekarang setara dengan lemparan koin. Kami melemparkan koin, dan jika itu adalah kepala, kami mengganti amplop, jika itu ekor, kami menempel pada amplop yang kami pegang. Dimana saya salah
EDIT 3 :
Oke, saya mengerti sekarang. Jika kita mendasarkan fungsi probabilitas dari pada (misalnya, kita mengambil sampel dari distribusi seragam dalam rentang , maka probabilitas tidak independen dari .x d ( 1 , 2 ⋅ x ) P ( d ∈ ( x , y ) ) P ( keputusan yang benar | d ∉ ( x , y ) )
Jadi, jika (dengan probabilitas ), tebakannya selalu benar, seperti sebelumnya. Namun, jika adalah angka yang lebih rendah, dan , maka memiliki peluang lebih tinggi untuk lebih rendah daripada daripada lebih tinggi dari , jadi kami bias terhadap keputusan yang salah. Alasan yang sama berlaku ketika lebih tinggi dari dua angka.p x d ∉ ( x , y ) d x x x
Itu berarti bahwa kita harus memilih proses menggambar secara independen dari . Dengan kata lain, kita perlu membuat perkiraan tentang parameter distribusi dari mana dan diambil; Yang terburuk yang terjadi adalah kita masih menebak secara acak, tetapi yang paling baik yang terjadi adalah dugaan kita benar - dan kemudian kita mendapat keuntungan. Bagaimana ini seharusnya lebih baik daripada menebak "x dan y akan, saya pikir, setidaknya $ 1 , tetapi paling banyak $ 10 , jadi jika , kita menyimpannya, dan jika tidak, kita menukarnya" Saya belum Lihat.x x y x > 5
Saya disesatkan oleh rumusan pop-sci tentang masalah dalam buku Wapner ( Ekspektasi Tak Terduga: Keingintahuan Bola Kristal Matematika ), yang menyatakan
"Dengan cara apa pun, pilih bilangan bulat positif acak" (Wapner menyarankan distribusi geometris - melempar koin sampai kepala pertama muncul, mengulangi proses jika ) "Jika menebak lebih tinggi dan jika tebak lebih rendah. (...) Anda akan menebak dengan benar lebih dari 50 persen dari waktu karena menunjuk dengan benar lebih dari 50 persen dari waktu! "d > x d < x d
sumber
Jawaban:
Ini lebih dikenal sebagai masalah dua-amplop . Paling umum jumlahnya diberikan sebagai dan tetapi tidak diharuskan bahwa ini menjadi masalahnya.2 AA 2A
Beberapa poin:
Anda tidak dapat memilih integer acak seragam *, tetapi bagian yang dikutip tampaknya tidak mengharuskannya seragam. Pilih distribusi - tidak masalah apa argumennya - asalkan memiliki probabilitas melebihi nilai terbatas apa pun.
Tidak masuk akal untuk memilih bilangan bulat dengan aturan keputusan yang dikutip, karena uang adalah diskrit yang berarti ada peluang bukan nol dan tidak ada yang terdaftar untuk kasus itu. (Atau sebagai alternatif, untuk mengubah aturan untuk menentukan apa yang harus dilakukan ketika mereka sama)d = xd d=x
Mengesampingkan hal itu, Anda dapat memilih dari beberapa distribusi berkelanjutan non-negatif - maka kita tidak perlu khawatir tentang kesetaraan.d
* (Anda juga tidak dapat memilih bilangan bulat non-negatif acak seragam atau bilangan bulat positif acak seragam)
Jika ternyata distribusi acak dari mana dipilih meliputi ini harus bekerja (memberi Anda lebih baik dari 50-50); jika distribusi macet di setengah itu tidak akan.M / 2x M/2
Namun, versi game ini yang pertama kali saya sajikan adalah bahwa amplop tersebut disajikan oleh seseorang yang (mungkin) berupaya meminimalkan penghasilan Anda dari game. Strategi menggunakan distribusi untuk memutuskan apakah akan beralih ke amplop lain masih akan berfungsi dalam contoh itu.
sumber
Argumen Wapner benar!
Beberapa komentar:
Masalah terkait tetapi berbeda:
Seperti yang disebutkan oleh beberapa @Glen_b dan @whuber, ada teka-teki terkait yang dikenal sebagai Two Envelope Problem di mana argumen yang keliru diberikan untuk selalu berganti amplop dan cacat dalam argumen dapat dilihat dengan mengambil pendekatan Bayesian dan menambahkan keyakinan sebelumnya atas masalah tersebut. isi kedua amplop.
Dalam beberapa hal, teka-teki yang dijelaskan di sini agak berbeda. Argumen Wapner benar!
sumber
Saya tertarik dengan ini dan mengambil pendekatan pragmatis bermain dengannya di Excel.
Saya menghasilkan tiga angka acak untuk x, y, dan d dalam kisaran 1-100. Saya kemudian melakukan perbandingan antara d dan x dan antara x dan y dan melihat hasilnya, benar atau salah.
Saya melakukan ini 500 kali dan mengulanginya beberapa kali dan secara teratur mendapatkan jawaban yang tepat dari 330 dari 500, seperti yang diperkirakan.
Saya kemudian meningkatkan kisaran d menjadi 1-10000 dan jawaban yang benar turun menjadi sekitar 260 untuk 500 berjalan.
Jadi ya, pemilihan d tergantung pada nilai yang diharapkan dari x dan y.
BoB
sumber
Saya pikir paradoks yang terlihat dengan perluasan Wapner dari persamaan p + (1-p) / 2 adalah bahwa ia mengasumsikan bahwa (1-p) / 2> 0. Untuk banyak rentang d nilai ini adalah 0.
Sebagai contoh: setiap d dipilih dari distribusi simetris berpusat pada nilai dalam amplop terbuka, memberikan kemungkinan salah 1/2 dan benar 1/2.
Distribusi apa pun yang dipilih secara asimetris tampaknya memihak pilihan dengan cara yang salah 1/2 kali.
Jadi apakah ada cara untuk memilih rentang dan distribusi untuk d sehingga persamaan ini berlaku?
sumber