Menjelaskan strategi campuran untuk game satu-shot

13

Dalam pengantar klasik teori permainan non-kooperatif, strategi campuran untuk pemain diajarkan sebagai distribusi ruang strategi untuk pemain. Distribusi pada dasarnya memberi kita probabilitas (katakanlah, set strategi diskrit) yang dengannya seorang pemain harus memainkan strategi dalam keseimbangan Nash.

Namun probabilitas membawa gagasan menjadi frekuensi dan ini pada dasarnya berarti fraksi jangka panjang di mana pemain harus memainkan strategi. Namun pengaturannya adalah permainan satu pukulan dan ini merupakan kontradiksi.

Bagaimana kita menyelesaikan kontradiksi ketika menjelaskan apa strategi campuran itu?

game-theory Bravo
sumber

2

Ini bukan kontradiksi dengan orang yang mengambil interpretasi kecenderungan probabilitas, yang melihat perilaku jangka panjang sebagai manifestasi dari probabilitas kasus tunggal.

Pburg

11

Ariel Rubinstein cenderung memiliki wawasan tentang pertanyaan-pertanyaan semacam ini.

Dia membahas interpretasi strategi campuran di bagian 3 makalah ini .

Beberapa kemungkinan interpretasi selain dari pengacakan yang disengaja:

Pemurnian: Strategi campuran adalah rencana tindakan berdasarkan informasi yang tidak ditentukan dalam model.
Kisah jangka panjang fiktif.
Populasi rata-rata, jadi bayangkan pemain ditarik dari beberapa distribusi populasi di mana berbagai jenis memainkan strategi murni yang berbeda. Distribusi populasi adalah distribusi strategi campuran.

Menarik kutipan tentang pemain 's strategi campuran mencerminkan ketidakpastian di kalangan ' s tentang apa yang akan lakukan: $i$ $-i$ $i$

Strategi campuran dapat dipandang sebagai keyakinan yang dipegang oleh semua pemain lain tentang tindakan pemain. Ekuilibrium strategi campuran kemudian merupakan tuple dari harapan pengetahuan umum, yang memiliki sifat bahwa semua tindakan yang diberikan probabilitas positif ketat adalah optimal, mengingat keyakinan tersebut. Perilaku pemain dapat dianggap oleh semua pemain lain sebagai hasil dari perangkat acak meskipun ini tidak terjadi. Mengadopsi interpretasi ini membutuhkan penilaian ulang dari banyak teori permainan terapan. Secara khusus, ini menyiratkan bahwa keseimbangan tidak mengarah pada prediksi (statistik atau sebaliknya) dari perilaku pemain. Tindakan pemain mana pun yang merupakan respons terbaik mengingat harapannya tentang pemain lain perilaku (strategi n - 1 lainnya) konsisten sebagai prediksi untuk tindakan i (ini mungkin termasuk tindakan yang berada di luar dukungan strategi campuran). Hal ini menjadikan statika komparatif atau analisis kesejahteraan dari kesetimbangan strategi campuran menjadi tidak berarti dan mempertanyakan literatur ekonomi besar yang menggunakan keseimbangan strategi campuran.

Pburg
sumber

6

Misalkan menunjukkan strategi yang melampirkan probabilitas untuk memainkan , dan mari menjadi seperangkat strategi seperti itu yang menghasilkan keseimbangan dalam suatu permainan simetris dua pemain. $s_i = \{p_A^i, p_B^i\}$ $A,B$ $s = \{s_i, s_i\}_i$

Seperti yang Anda katakan, kami berpikir tentang menjadi probabilitas di mana tindakan tertentu dimainkan. Setiap kali bukan singleton, kita memiliki multi-equilibria, sesuatu yang tidak disukai sebagian besar cabang ekonomi, karena itu membuat model penyelesaian cukup sulit, dan non-keunikan sulit untuk dikerjakan: Bagaimana kita mensimulasikan model? Manakah dari keseimbangan yang sedang dimainkan? $s_i$ $s$

Setidaknya, dengan keseimbangan strategi campuran, kita tahu kemungkinan masing-masing keseimbangan terjadi. Anda tidak menyukai probabilitas sejauh mereka membawa frekuensi, yang Anda katakan bertentangan dengan gagasan permainan menjadi satu tembakan.

Namun secara simultan , game yang menjadi satu pukulan tidak berarti game hanya dimainkan satu kali. Dalam dunia dengan banyak individu, setiap orang dapat menemukan pasangan dan bermain salah satu strategi dalam , sejauh yang kita (pada saat yang sama!) Menemukan dari mereka dalam keseimbangan , dan fraksi individu memainkan keseimbangan berikutnya, dll. $s$ $p_A$ $\{A, A\}$ $p_B$

Non-Simulatenously Sebagai alternatif, Anda bisa berargumen bahwa di dunia dengan banyak anonimitas, orang melupakan mitra yang pernah mereka mainkan sebelumnya. Kami memiliki banyak orang bermain strategi di pada waktu , maka kita de-pasangan mereka, memberi semua orang mitra baru dan membiarkan mereka bermain lagi. Bahkan jika ada kemungkinan bertemu dengan pria yang sama lagi: Karena kemungkinan itu menjadi nol, Anda bisa memodelkan ini sebagai game yang diulang dengan faktor diskon $s$ $t$ . $\delta\rightarrow 0$

Kurangnya Komitmen Akhirnya, pikirkan tentang situasi yang sebenarnya merupakan permainan berulang, seperti interaksi antara pemerintah dan konsumen. Meskipun ini dapat dimodelkan sebagai permainan yang berulang, kita mungkin berpikir bahwa pemerintah tidak dapat berkomitmen untuk urutan strategi. Oleh karena itu, alih-alih memodelkan ini sebagai permainan yang diulang, kami memodelkannya sebagai pengulangan dari keseimbangan satu-shot: Diberikan horizon waktu , kita akan melihat bahwa pada saat itu, pemerintah dan konsumen memainkan keseimbangan $T$ $T\cdot p_A$ $\{A, A\}$ , dll.

FooBar
sumber

2

Ini adalah suplemen dari kutipan Pburg:

Satu pandangan dalam Aumann dan Brandenburger (1995) adalah bahwa strategi campuran hanya di mata lawan. Dalam gim pemain, rangkaian negara dunia . Untuk keadaan , memenuhi spesifikasi berikut: $N$ $\mathbf {S} : = \times_{i \in N} S_i$ $s \in \mathbf S$

$i$ $\pi_i : \mathbf {S} \to S_i$ $i$ $i$ $s_i$ $\pi_i^{-1}(s_i)$ $\pi_i^{-1}(s_i)$ $s_i$
$A_i$ $i$ $a_i : \mathbf{S} \to A_i$ $\left.a_i\right|_{\pi_i^{-1}(s_i)}$
$i$ $g_i$ $a_i$ $g(s) : \mathbf{A} \to \mathbb{R}$ $s \in \pi_i^{-1}(s_i)$ $s_i$

Metta World Peace
sumber

1

Nah, inilah kesempatan saya untuk menjawab, mengikuti makalah ini dalam Fisika http://bayes.wustl.edu/etj/articles/prob.in.qm.pdf. Saya pikir, kecenderungan itu adalah interpretasi yang bagus dari strategi campuran, tetapi lebih formal kita harus mengatakan itu menangkap ketidaktahuan sang pemodel. Kami mengatakan, apa pun yang terjadi, pada kenyataannya semua strategi dapat diambil (jika dukungan di mana-mana positif) tetapi konsep solusi mengatakan pasti lebih mungkin. Probabilitas di sini mengukur ketidaktahuan pemodel dan merupakan hasil dari kurangnya informasi dari ahli teori permainan tentang permainan. Untuk memperjelas pemikiran tentang dataset yang ditingkatkan ini di mana kami mengetahui informasi tambahan tentang permainan, katakanlah kami berbicara dengan salah satu pemain dan ia meyakinkan kami bahwa ia akan mengambil satu strategi apa pun yang terjadi, maka kami dapat membuat prediksi yang lebih tajam di bentuk strategi murni. Frekuensi muncul ketika kita menganggap game sebagai game biasa,

pengguna157623
sumber

0

Itu tidak berlaku untuk semua game, tetapi ada juga situasi di mana (setidaknya beberapa) pemain benar-benar menggunakan perangkat pengacakan dalam game yang dapat dilihat sebagai satu-shot. Di sini, distribusi probabilitas bukan frekuensi, mereka adalah distribusi yang menggunakan perangkat pengacakan. Setiap ekuilibrium strategi campuran kemudian menjadi keseimbangan dalam arti ex-ante (meskipun pemain mungkin menarik sekali dari perangkat pengacakan satu kali, dan mungkin tidak ada perasaan di mana situasi ex-post adalah keseimbangan).

Contohnya termasuk:

Martin Van der Linden
sumber

Menjelaskan strategi campuran untuk game satu-shot

Jawaban: