Ada dua amplop. Satu berisi uang dan lainnya berisi jumlah uang. Jumlah pasti " " tidak diketahui oleh saya, tapi saya tahu di atas. Saya mengambil satu amplop dan saya membukanya. Saya melihat uang di dalamnya, jelas di mana .
Sekarang saya ditawari untuk menyimpan atau mengganti amplop.
Nilai switching yang diharapkan adalah . Nilai yang diharapkan untuk menyimpan amplop saya adalah.
Sepertinya saya harus selalu mengganti amplop. Dua pertanyaan saya:
Apakah alasan ini benar?
Apakah berbeda jika saya tidak diizinkan untuk membuka amplop dan melihat jumlah uang, dan kemudian saya diberi pilihan untuk beralih tanpa batas?
microeconomics
expected-utility
Kavaleri Kitsune
sumber
sumber
Jawaban:
Berikut ini adalah pendekatan "teori maksimisasi utilitas / permainan yang diharapkan" untuk masalah ini (dengan set probabilitas teoretis set). Dalam kerangka kerja seperti itu, jawabannya tampak jelas.
PREMIS
Kami diberitahu dalam kejujuran mutlak bahwa, untuk jumlah uang yang benar-benar positif, dua tiket berikut ditempatkan dalam sebuah kotak: { A = x , B = 2 x } dengan nomor identifikasi 1 dan { A = 2 x , B = x } dengan nomor identifikasi yang ditetapkan 0 . Kemudian undian dari variabel acak Bernoulli ( p = 0,5 ) dieksekusi, dan berdasarkan pada hasil dan peristiwa yang telah terjadi, jumlah x danx {A=x,B=2x} 1 {A=2x,B=x} 0 (p=0.5) x ditempatkan dalam amplop A dan B . Kami tidak diberi tahu berapa nilai x , atau berapa jumlah amplop yang masuk.2x A B x
KASUS Pertama: Pilih amplop dengan opsi untuk berganti tanpa membukanya
Masalah pertama adalah bagaimana kita memilih amplop ? Ini ada hubungannya dengan preferensi. Jadi asumsikan bahwa kita diharapkan memaksimalkan utilitas, dengan fungsi utilitas .u()
Kita dapat memodelkan struktur probabilistik di sini dengan mempertimbangkan dua variabel acak dikotomis, dan B yang mewakili amplop, dan jumlah di dalamnya. Dukungan masing-masing adalah { x , 2 x } . Tetapi mereka tidak mandiri. Jadi kita harus mulai dengan distribusi bersama. Dalam bentuk tabel, distribusi gabungan, dan distribusi marginal yang sesuai adalahA B {x,2x}
Ini memberitahu kita bahwa dan B memiliki distribusi marginal yang identik.A B
Tetapi ini berarti bahwa tidak masalah bagaimana kita memilih amplop, karena kita akan selalu mendapatkan utilitas yang sama ,
Apa yang kita hadapi di sini adalah pertaruhan majemuk (cara memilih amplop) dibandingkan dua pertaruhan identik (masing-masing amplop). Kita dapat memilih dengan probabilitas 1 , 0 , atau apa pun di antaranya (dan saling melengkapi untuk B ). Itu tidak masalah. Kami akan selalu mendapatkan utilitas yang diharapkan sama. Perhatikan bahwa sikap kita terhadap risiko tidak berperan di sini.A 1 0 B
Jadi kami memang memilih amplop, katakanlah , dan kami sedang melihatnya. Apa yang sekarang menjadi utilitas yang kita harapkan? Persis sama dengan sebelum memilih . Memilih amplop dengan cara apa pun, tidak memengaruhi probabilitas apa yang ada di dalamnya.A
Jadi di sini, kami acuh tak acuh untuk beralih. , dan sebenarnya kita juga bisa mengacak.
KASUS ke-2: MEMBUKA AMPLOP DENGAN opsi untuk beralih setelah
Ayo lihat. Aku bertanya-tanya, ada apa
Tapi saya juga bertanya-tanya, ada apa
Sekarang semua imbalan dalam matriks diketahui. Apakah ada strategi dominan murni?
Hasil yang diharapkan dari strategi "Switch" adalah
Hasil yang diharapkan dari strategi "Don't Switch" adalah
Kita harus beralih jika
Dan sekarang , sikap terhadap risiko menjadi kritis. Tidak sulit untuk menyimpulkan bahwa di bawah pengambilan risiko dan perilaku netral risiko, kita harus Beralih.
Mengenai perilaku yang menghindari risiko , saya menemukan hasil yang elegan:
Untuk fungsi utilitas yang "kurang cekung" (tepat di atas) daripada logaritmik (katakanlah, akar kuadrat), maka kita masih harus Beralih.
Untuk "lebih cekung" daripada (tepatnya di bawah) fungsi utilitas logaritmik, kita tidak boleh Berpindah.
Saya menutup dengan diagram dari kasus logaritmik
sumber
Jika Anda membuka amplop E1 , dan melihat bahwa nilainya adalah E1 = Y , maka benar bahwa nilai E2 amplop lainnya adalah dalam {E2 = Y / 2, E2 = 2Y} .
Juga benar bahwa nilai yang diharapkan dari amplop itu adalah (Y / 2) * Pr (E2 = Y / 2) + (2Y) * Pr (E2 = 2Y) .
Kesalahannya adalah mengasumsikan bahwa Pr (E2 = Y / 2) = Pr (E2 = 2Y) = 1/2 terlepas dari apa Y itu. Cara sederhana untuk menunjukkan ini, adalah dengan berasumsi bahwa setiap amplop berisi uang kertas AS dari berbagai denominasi. Jika Y = $ 1 , maka tidak mungkin bagi E2 menjadi Y / 2 .
Bukti yang lebih ketat terlalu rinci untuk diberikan di sini, tetapi ringkasannya adalah untuk pertama mengasumsikan bahwa, untuk nilai Z apa pun , bahwa Pr (Z / 2 <= E2 <Z) = Pr (Z <= E2 <2Z) . Ini pada dasarnya asumsi yang sama seperti pada paragraf terakhir, diperluas ke berbagai nilai. Tetapi jika ini benar untuk setiap nilai Z , itu berarti Pr (Z * 2 ^ (N-1) <= E2 <Z * 2 ^ (N-1)) adalah konstan untuk setiap nilai N , dari -inf ke inf. Karena itu tidak mungkin, anggapan itu tidak mungkin benar.
+++++
Itu mungkin agak membingungkan, jadi izinkan saya mencoba sebuah contoh. Anda diberi dua set dua amplop. Dalam satu set, mereka berisi 10 dan 20 dolar. Di yang lain, mereka berisi 20 dan 40. Anda memilih satu set, dan kemudian buka satu amplop di set itu untuk menemukan 20. Anda kemudian ditawari kesempatan untuk beralih ke amplop lain di set itu. Seharusnya kamu?
Ya, harus beralih. Keuntungan yang diharapkan dengan beralih ke amplop lain adalah [(20-10) + (20-40)] / 2 = +5.
Perhatikan bahwa kejadian ini - yaitu, mengetahui bahwa Anda menemukan 20, dan bukan 10 atau 40, cocok dengan kondisi yang Anda jelaskan dalam pertanyaan Anda. Jadi solusimu bekerja. Tetapi percobaan itu sendiri tidak sesuai dengan deskripsi itu. Jika Anda telah menemukan 10, atau jika Anda telah menemukan 40, kemungkinan amplop lain memiliki 20 adalah 100%. Keuntungan yang diharapkan adalah +10, dan -20, masing-masing. Dan jika Anda rata-rata tiga kemungkinan keuntungan atas probabilitas Anda akan mendapatkan tiga nilai, Anda mendapatkan 10/4 + 5/2 - 20/4 = 0.
sumber
Umumnya masalah tidak dapat dipecahkan karena Anda belum menentukan prosedur pengacakan seluruh percobaan.
Tapi biarkan Y menjadi nilai amplop yang Anda pilih, dan X amplop lainnya. Jawabannya kemudian - yang merupakan harapan bersyarat . Namun, dengan asumsi distribusi Y yang paling umum, Y secara seragam diambil dari semua . Tapi kemudian , dan oleh paradoks Borel-Kolmogorov harapan itu tidak terpecahkan.E[X|Y=y] R P r ( Y = y ) = 0R Pr(Y=y)=0
sumber