Paradox amplop

Ada dua amplop. Satu berisi $x$ uang dan lainnya berisi $2x$ jumlah uang. Jumlah pasti " $x$ " tidak diketahui oleh saya, tapi saya tahu di atas. Saya mengambil satu amplop dan saya membukanya. Saya melihat $y$ uang di dalamnya, jelas di mana $y \in \{x, 2x\}$ .

Sekarang saya ditawari untuk menyimpan atau mengganti amplop.

Nilai switching yang diharapkan adalah $(\frac{1}{2} \cdot 2y + \frac{1}{2} \cdot \frac{1}{2}y) = \frac{5}{4}y$ . Nilai yang diharapkan untuk menyimpan amplop saya adalah $y$ .

Sepertinya saya harus selalu mengganti amplop. Dua pertanyaan saya:

Apakah alasan ini benar?

Apakah berbeda jika saya tidak diizinkan untuk membuka amplop dan melihat $y$ jumlah uang, dan kemudian saya diberi pilihan untuk beralih tanpa batas?

microeconomics expected-utility Kavaleri Kitsune
sumber

Terkait: en.wikipedia.org/wiki/Two_envelopes_problem

Herr K.

Anda tidak bisa hanya mengambil ekspektasi, Anda harus mulai dengan keyakinan tentang x dan memperbarui keyakinan Anda sesuai dengan aturan Bayes. Begitu Anda melihat y, keyakinan Anda tentang amplop mana yang Anda buka akan berubah.

HRSE

Say x didistribusikan secara seragam antara 0 dan

. Lalu apa?

\infty

$\infty$

Kitsune Cavalry

@KitsuneCavalry Tidak ada pembagian seperti itu. (Tolong kirimkan saya sebuah program menghasilkan distribusi seperti itu.) Sebenarnya tidak ada resolusi yang menghasilkan kepercayaan pior yang diberikan dalam pertanyaan Anda untuk semua nilai

. Dalam tautan Herr K. ini dijelaskan dalam en.wikipedia.org/wiki/…

y

$y$

Giskard

@Kitsune Cavalry Distribusi seragam di atas setengah baris (atau seluruh baris) adalah tidak tepat yang terkenal sebelumnya dalam statistik Bayesian, lihat stat rasa.stackexchange.com/a/97790/28746 atau stats.stackexchange.com/a/ 35794/28746

Alecos Papadopoulos

Jawaban:

Berikut ini adalah pendekatan "teori maksimisasi utilitas / permainan yang diharapkan" untuk masalah ini (dengan set probabilitas teoretis set). Dalam kerangka kerja seperti itu, jawabannya tampak jelas.

PREMIS

Kami diberitahu dalam kejujuran mutlak bahwa, untuk jumlah uang yang benar-benar positif, dua tiket berikut ditempatkan dalam sebuah kotak: dengan nomor identifikasi dan dengan nomor identifikasi yang ditetapkan . Kemudian undian dari variabel acak Bernoulli dieksekusi, dan berdasarkan pada hasil dan peristiwa yang telah terjadi, jumlah dan $x$ $\{A=x, B= 2x\}$ $1$ $\{A=2x, B= x\}$ $0$ $(p=0.5)$ $x$ ditempatkan dalam amplop dan . Kami tidak diberi tahu berapa nilai , atau berapa jumlah amplop yang masuk. $2x$ $A$ $B$ $x$

KASUS Pertama: Pilih amplop dengan opsi untuk berganti tanpa membukanya

Masalah pertama adalah bagaimana kita memilih amplop ? Ini ada hubungannya dengan preferensi. Jadi asumsikan bahwa kita diharapkan memaksimalkan utilitas, dengan fungsi utilitas . $u()$

Kita dapat memodelkan struktur probabilistik di sini dengan mempertimbangkan dua variabel acak dikotomis, dan mewakili amplop, dan jumlah di dalamnya. Dukungan masing-masing adalah . Tetapi mereka tidak mandiri. Jadi kita harus mulai dengan distribusi bersama. Dalam bentuk tabel, distribusi gabungan, dan distribusi marginal yang sesuai adalah $A$ $B$ $\{x, 2x\}$

\begin{array}{rr} A / B \to & x & 2 x & Marg A \\ x & 0 & 0.5 & 0.5 \\ 2 x & 0.5 & 0 & 0.5 \\ Marg B & 0.5 & 0.5 & 1.00 \end{array}

$\begin{array}{| r | r | } \hline \text{A} \;/ \;\;\text{B} \rightarrow & x & 2x & \text {Marg A} \\ \hline \hline x & 0 & 0.5 & 0.5\\ \hline 2x & 0.5 & 0 & 0.5 \\ \hline \text{Marg B} & 0.5 & 0.5 & 1.00 \\ \hline \end{array}$

Ini memberitahu kita bahwa dan memiliki distribusi marginal yang identik. $A$ $B$

Tetapi ini berarti bahwa tidak masalah bagaimana kita memilih amplop, karena kita akan selalu mendapatkan utilitas yang sama ,

0.5 \cdot u (x) + 0.5 \cdot u (2 x)

$0.5 \cdot u(x) + 0.5\cdot u(2x)$

Apa yang kita hadapi di sini adalah pertaruhan majemuk (cara memilih amplop) dibandingkan dua pertaruhan identik (masing-masing amplop). Kita dapat memilih dengan probabilitas , , atau apa pun di antaranya (dan saling melengkapi untuk ). Itu tidak masalah. Kami akan selalu mendapatkan utilitas yang diharapkan sama. Perhatikan bahwa sikap kita terhadap risiko tidak berperan di sini. $A$ $1$ $0$ $B$

Jadi kami memang memilih amplop, katakanlah , dan kami sedang melihatnya. Apa yang sekarang menjadi utilitas yang kita harapkan? Persis sama dengan sebelum memilih . Memilih amplop dengan cara apa pun, tidak memengaruhi probabilitas apa yang ada di dalamnya. $A$

$B$

$A$ $B$

Jadi di sini, kami acuh tak acuh untuk beralih. , dan sebenarnya kita juga bisa mengacak.

KASUS ke-2: MEMBUKA AMPLOP DENGAN opsi untuk beralih setelah

$A$ $y \in \{x, 2x\}$

Ayo lihat. Aku bertanya-tanya, ada apa

P (A = x ∣ A \in {x, 2 x}) = ?

$P(A = x \mid A \in \{x, 2x\}) = ?$

$\{x, 2x\}$ $A$ $A$

Tapi saya juga bertanya-tanya, ada apa

P (B = x ∣ A \in {x, 2 x}) = ?

$P(B = x \mid A \in \{x, 2x\}) = ?$

$\big \{A \in \{x, 2x\}\big\}$ $(A,B)$ $B$ $B$

$u(y)$

y = x, u (A) = u (x) ⟹ u (B) = u (2 x)

$y = x, u(A) = u(x) \implies u(B) = u(2x)$

y = 2 x, u (A) = u (2 x) ⟹ u (B) = u (x)

$y = 2x, u(A) = u(2x)\implies u(B) = u(x)$

$p=0.5$

$p=0.5$ $y=x$ $p=0.5$ $y=2x$

\begin{array}{rr} We / nature \to & y = x & y = 2 x \\ Switch & u (2 x) & u (x) \\ Don't Switch & u (y) & u (y) \end{array}

$\begin{array}{| r | r | } \hline \text{We} \;/ \;\;\text{nature} \rightarrow &y= x & y=2x \\ \hline \text{Switch} & u(2x) & u(x) \\ \hline \text{Don't Switch} & u(y) & u(y) \\ \hline \end{array}$

$u(x)$ $u(2x)$ $u(y)$ $u(y)$ $x$ $y=x$ $u(2x) = u(2y)$ $y=2x$ $u(x) = u(y/2)$

\begin{array}{rr} We / nature \to & y = x & y = 2 x \\ Switch & u (2 y) & u (y / 2) \\ Don't Switch & u (y) & u (y) \end{array}

$\begin{array}{| r | r | } \hline \text{We} \;/ \;\;\text{nature} \rightarrow &y= x & y=2x \\ \hline \text{Switch} & u(2y) & u(y/2) \\ \hline \text{Don't Switch} & u(y) & u(y) \\ \hline \end{array}$

Sekarang semua imbalan dalam matriks diketahui. Apakah ada strategi dominan murni?

Hasil yang diharapkan dari strategi "Switch" adalah

E (V_{S}) = 0.5 \cdot u (2 y) + 0.5 \cdot u (y / 2)

$E(V_S) = 0.5\cdot u(2y) + 0.5 \cdot u(y/2)$

Hasil yang diharapkan dari strategi "Don't Switch" adalah

E (V_{D S}) = u (y)

$E(V_{DS}) = u(y)$

Kita harus beralih jika

E (V_{S}) > E (V_{D S}) ⟹ 0.5 \cdot u (2 y) + 0.5 \cdot u (y / 2) > u (y)

$E(V_S) > E(V_{DS}) \implies 0.5\cdot u(2y) + 0.5 \cdot u(y/2) > u(y)$

Dan sekarang , sikap terhadap risiko menjadi kritis. Tidak sulit untuk menyimpulkan bahwa di bawah pengambilan risiko dan perilaku netral risiko, kita harus Beralih.

Mengenai perilaku yang menghindari risiko , saya menemukan hasil yang elegan:

Untuk fungsi utilitas yang "kurang cekung" (tepat di atas) daripada logaritmik (katakanlah, akar kuadrat), maka kita masih harus Beralih.

$u(y) = \ln y$

Untuk "lebih cekung" daripada (tepatnya di bawah) fungsi utilitas logaritmik, kita tidak boleh Berpindah.

Saya menutup dengan diagram dari kasus logaritmik

$y=4$ $y/2 =2, 2y = 8$ $Γ-Δ-Ε$ $50-50$ $\Delta$ $Γ-Δ-Ε$ $\ln(4)$

Alecos Papadopoulos
sumber

Meminta "penghindaran risiko" melalui fungsi utilitas logaritmik tidak menyelesaikan paradoks. Sebagaimana dicatat oleh @HRSE, menggunakan teorema Bayes, probabilitas bahwa hadiah yang dan yang tidak 0,5 setelah melihat jumlah dalam amplop pertama. Hal ini hanya akan berlaku untuk seragam yang tidak benar pada sebelumnya sangat dipertanyakan (untuk ). Jika menggunakan sebelum tepat (mencerminkan keyakinan seseorang tentang ), solusinya menjadi beralih jika cukup kecil dan untuk menyimpan amplop pertama jika cukup besar. Lihat jstor.org/ stabil / 2.685.310 .

u (2 y)

$u(2y)$

u (y / 2

$u(y/2$

x

$x$

x > 0

$x>0$

x

$x$

x

$x$

y

$y$

y

$y$

Jarle Tufto

@JarleTufto Seperti yang saya lihat, seragam sebelumnya adalah benar sebelumnya, jika seseorang memutuskan untuk percaya penyelenggara permainan, ketika mereka mengatakan bahwa jumlah uang dimasukkan ke dalam amplop setelah undian Bernoulli dengan . Jika seseorang ingin curiga, tidak percaya pada panitia dan membentuk kepercayaan lain sebelumnya, tentu saja itu adalah haknya, tetapi ia harus datang dengan beberapa argumen untuk meyakinkan saya tentang a) mengapa organisator berbohong dan b) bagaimana apakah dia memilih yang berbeda sebelum dia memilih. Perhatikan bahwa jawaban saya mengandaikan bahwa kami percaya pada penyelenggara masalah ini.

p = 0.5

$p=0.5$

Alecos Papadopoulos

Saya tentu saja setuju bahwa Anda diberi masing-masing amplop yang berisi jumlah dan masing-masing dengan probabilitas yang sama 1/2. Apa yang saya katakan adalah bahwa seragam implisit yang tidak tepat sebelum yang Anda gunakan, yaitu, , untuk semua mengarah ke paradoks karena teorema Bayes kemudian mengarah ke mana adalah jumlah yang diamati dalam amplop pertama. Sebaliknya, menggunakan prior , probabilitas bersyarat ini berbeda dan keputusan optimal bergantung pada (dan tentu saja fungsi utilitas).

X

$X$

2 X

$2X$

X

$X$

π (x) = 1

$\pi(x) =1$

x > 0

$x>0$

P (X = y | Y = y) = P (X = y / 2 | Y = y) = 1 / 2

$P(X=y|Y=y) = P(X=y/2|Y=y)=1/2$

y

$y$

π (x)

$\pi(x)$

y

$y$

Jarle Tufto

@ JarleTufto Ini tidak patut sebelum Anda sebutkan, itu mencerminkan probabilitas terkait dengan apa?

Alecos Papadopoulos

Jumlah uang dalam dua amplop adalah dan . Distribusi probabilitas sebelumnya mewakili keyakinan Anda tentang sebelum membuka amplop apa pun. Anda secara implisit menggunakan ini sebelumnya atau Anda melakukan kesalahan menyamakan probabilitas kondisional terbalik.

X

$X$

2 X

$2X$

X

$X$

Jarle Tufto

Jika Anda membuka amplop E1 , dan melihat bahwa nilainya adalah E1 = Y , maka benar bahwa nilai E2 amplop lainnya adalah dalam {E2 = Y / 2, E2 = 2Y} .

Juga benar bahwa nilai yang diharapkan dari amplop itu adalah (Y / 2) * Pr (E2 = Y / 2) + (2Y) * Pr (E2 = 2Y) .

Kesalahannya adalah mengasumsikan bahwa Pr (E2 = Y / 2) = Pr (E2 = 2Y) = 1/2 terlepas dari apa Y itu. Cara sederhana untuk menunjukkan ini, adalah dengan berasumsi bahwa setiap amplop berisi uang kertas AS dari berbagai denominasi. Jika Y = $ 1 , maka tidak mungkin bagi E2 menjadi Y / 2 .

Bukti yang lebih ketat terlalu rinci untuk diberikan di sini, tetapi ringkasannya adalah untuk pertama mengasumsikan bahwa, untuk nilai Z apa pun , bahwa Pr (Z / 2 <= E2 <Z) = Pr (Z <= E2 <2Z) . Ini pada dasarnya asumsi yang sama seperti pada paragraf terakhir, diperluas ke berbagai nilai. Tetapi jika ini benar untuk setiap nilai Z , itu berarti Pr (Z * 2 ^ (N-1) <= E2 <Z * 2 ^ (N-1)) adalah konstan untuk setiap nilai N , dari -inf ke inf. Karena itu tidak mungkin, anggapan itu tidak mungkin benar.

+++++

Itu mungkin agak membingungkan, jadi izinkan saya mencoba sebuah contoh. Anda diberi dua set dua amplop. Dalam satu set, mereka berisi 10 dan 20 dolar. Di yang lain, mereka berisi 20 dan 40. Anda memilih satu set, dan kemudian buka satu amplop di set itu untuk menemukan 20. Anda kemudian ditawari kesempatan untuk beralih ke amplop lain di set itu. Seharusnya kamu?

Ya, harus beralih. Keuntungan yang diharapkan dengan beralih ke amplop lain adalah [(20-10) + (20-40)] / 2 = +5.

Perhatikan bahwa kejadian ini - yaitu, mengetahui bahwa Anda menemukan 20, dan bukan 10 atau 40, cocok dengan kondisi yang Anda jelaskan dalam pertanyaan Anda. Jadi solusimu bekerja. Tetapi percobaan itu sendiri tidak sesuai dengan deskripsi itu. Jika Anda telah menemukan 10, atau jika Anda telah menemukan 40, kemungkinan amplop lain memiliki 20 adalah 100%. Keuntungan yang diharapkan adalah +10, dan -20, masing-masing. Dan jika Anda rata-rata tiga kemungkinan keuntungan atas probabilitas Anda akan mendapatkan tiga nilai, Anda mendapatkan 10/4 + 5/2 - 20/4 = 0.

JeffJo
sumber

Mengapa saya menganggap amplop tidak dapat memiliki 50 sen di dalamnya? Juga pertanyaannya adalah secara khusus menanyakan waktu di mana Anda tidak tahu jumlah yang mungkin ada di dalamnya, hanya jumlah relatif yang mungkin, jadi saya tidak benar-benar mengikuti ini.

Kitsune Cavalry

Saya mengatakan itu adalah pendekatan yang sederhana. Dimulai dengan 'berasumsi bahwa setiap amplop berisi uang kertas AS.' Karena Anda tidak dapat memiliki 50 sen dalam uang kertas AS, Pr (E2 = 1) = 1. Intinya adalah, mengasumsikan Y / 2 dan 2Y sama-sama mungkin, ketika Anda tidak tahu Y, mengasumsikan distribusi de facto untuk Y yang tidak mungkin untuk dicapai.

2 | E 1 =

$2|E1=$

JeffJo

Umumnya masalah tidak dapat dipecahkan karena Anda belum menentukan prosedur pengacakan seluruh percobaan.

Tapi biarkan Y menjadi nilai amplop yang Anda pilih, dan X amplop lainnya. Jawabannya kemudian - yang merupakan harapan bersyarat . Namun, dengan asumsi distribusi Y yang paling umum, Y secara seragam diambil dari semua . Tapi kemudian , dan oleh paradoks Borel-Kolmogorov harapan itu tidak terpecahkan. $E[X|Y=y]$ $\mathbb{R}$ $Pr(Y=y)=0$

John Rambo
sumber

@JeffJo, saya tidak bisa berkomentar di bawah posting Anda karena tidak memiliki reputasi yang cukup. Saya menambahkan jawaban ini karena saya yakin ini terkait dengan pos Anda.

John Rambo