Dalam pengantar klasik teori permainan non-kooperatif, strategi campuran untuk pemain diajarkan sebagai distribusi ruang strategi untuk pemain. Distribusi pada dasarnya memberi kita probabilitas (katakanlah, set strategi diskrit) yang dengannya seorang pemain harus memainkan strategi dalam keseimbangan Nash.
Namun probabilitas membawa gagasan menjadi frekuensi dan ini pada dasarnya berarti fraksi jangka panjang di mana pemain harus memainkan strategi. Namun pengaturannya adalah permainan satu pukulan dan ini merupakan kontradiksi.
Bagaimana kita menyelesaikan kontradiksi ketika menjelaskan apa strategi campuran itu?
game-theory
Bravo
sumber
sumber
Jawaban:
Ariel Rubinstein cenderung memiliki wawasan tentang pertanyaan-pertanyaan semacam ini.
Dia membahas interpretasi strategi campuran di bagian 3 makalah ini .
Beberapa kemungkinan interpretasi selain dari pengacakan yang disengaja:
Menarik kutipan tentang pemain 's strategi campuran mencerminkan ketidakpastian di kalangan - i ' s tentang apa yang saya akan lakukan:saya - saya saya
sumber
Misalkan menunjukkan strategi yang melampirkan probabilitas untuk memainkan A , B , dan mari s = { s i , s i } i menjadi seperangkat strategi seperti itu yang menghasilkan keseimbangan dalam suatu permainan simetris dua pemain.ssaya= { psayaSEBUAH, halsayaB} A , B s = { ssaya, ssaya}saya
Seperti yang Anda katakan, kami berpikir tentang menjadi probabilitas di mana tindakan tertentu dimainkan. Setiap kali s bukan singleton, kita memiliki multi-equilibria, sesuatu yang tidak disukai sebagian besar cabang ekonomi, karena itu membuat model penyelesaian cukup sulit, dan non-keunikan sulit untuk dikerjakan: Bagaimana kita mensimulasikan model? Manakah dari keseimbangan yang sedang dimainkan?ssaya s
Setidaknya, dengan keseimbangan strategi campuran, kita tahu kemungkinan masing-masing keseimbangan terjadi. Anda tidak menyukai probabilitas sejauh mereka membawa frekuensi, yang Anda katakan bertentangan dengan gagasan permainan menjadi satu tembakan.
Namun secara simultan , game yang menjadi satu pukulan tidak berarti game hanya dimainkan satu kali. Dalam dunia dengan banyak individu, setiap orang dapat menemukan pasangan dan bermain salah satu strategi dalam , sejauh yang kita (pada saat yang sama!) Menemukan p A dari mereka dalam keseimbangan { A , A } , dan fraksi p B individu memainkan keseimbangan berikutnya, dll.s halSEBUAH { A , A } halB
Non-Simulatenously Sebagai alternatif, Anda bisa berargumen bahwa di dunia dengan banyak anonimitas, orang melupakan mitra yang pernah mereka mainkan sebelumnya. Kami memiliki banyak orang bermain strategi di pada waktu t , maka kita de-pasangan mereka, memberi semua orang mitra baru dan membiarkan mereka bermain lagi. Bahkan jika ada kemungkinan bertemu dengan pria yang sama lagi: Karena kemungkinan itu menjadi nol, Anda bisa memodelkan ini sebagai game yang diulang dengan faktor diskons t .δ→ 0
Kurangnya Komitmen Akhirnya, pikirkan tentang situasi yang sebenarnya merupakan permainan berulang, seperti interaksi antara pemerintah dan konsumen. Meskipun ini dapat dimodelkan sebagai permainan yang berulang, kita mungkin berpikir bahwa pemerintah tidak dapat berkomitmen untuk urutan strategi. Oleh karena itu, alih-alih memodelkan ini sebagai permainan yang diulang, kami memodelkannya sebagai pengulangan dari keseimbangan satu-shot: Diberikan horizon waktu , kita akan melihat bahwa T ⋅ p A pada saat itu, pemerintah dan konsumen memainkan keseimbangan { A , A }T T⋅ hlmSEBUAH { A , A } , dll.
sumber
Ini adalah suplemen dari kutipan Pburg:
Satu pandangan dalam Aumann dan Brandenburger (1995) adalah bahwa strategi campuran hanya di mata lawan. Dalam gim pemain, rangkaian negara dunia S : = × i ∈ N S i . Untuk keadaan s ∈ S , memenuhi spesifikasi berikut:N S : = ×i ∈ NSsaya s ∈ S
sumber
Nah, inilah kesempatan saya untuk menjawab, mengikuti makalah ini dalam Fisika http://bayes.wustl.edu/etj/articles/prob.in.qm.pdf. Saya pikir, kecenderungan itu adalah interpretasi yang bagus dari strategi campuran, tetapi lebih formal kita harus mengatakan itu menangkap ketidaktahuan sang pemodel. Kami mengatakan, apa pun yang terjadi, pada kenyataannya semua strategi dapat diambil (jika dukungan di mana-mana positif) tetapi konsep solusi mengatakan pasti lebih mungkin. Probabilitas di sini mengukur ketidaktahuan pemodel dan merupakan hasil dari kurangnya informasi dari ahli teori permainan tentang permainan. Untuk memperjelas pemikiran tentang dataset yang ditingkatkan ini di mana kami mengetahui informasi tambahan tentang permainan, katakanlah kami berbicara dengan salah satu pemain dan ia meyakinkan kami bahwa ia akan mengambil satu strategi apa pun yang terjadi, maka kami dapat membuat prediksi yang lebih tajam di bentuk strategi murni. Frekuensi muncul ketika kita menganggap game sebagai game biasa,
sumber
Itu tidak berlaku untuk semua game, tetapi ada juga situasi di mana (setidaknya beberapa) pemain benar-benar menggunakan perangkat pengacakan dalam game yang dapat dilihat sebagai satu-shot. Di sini, distribusi probabilitas bukan frekuensi, mereka adalah distribusi yang menggunakan perangkat pengacakan. Setiap ekuilibrium strategi campuran kemudian menjadi keseimbangan dalam arti ex-ante (meskipun pemain mungkin menarik sekali dari perangkat pengacakan satu kali, dan mungkin tidak ada perasaan di mana situasi ex-post adalah keseimbangan).
Contohnya termasuk:
sumber