Saya sedang mengerjakan tesis Master saya berdasarkan rasionalitas terbatas dalam model teori permainan perilaku, saya ingin tahu apakah QRE (Quantal Response Equilibrium) dapat diterapkan ke permainan di mana pemain memiliki set strategi yang berbeda dengan apa yang telah saya lihat dalam permainan alokasi sumber daya , jika ya, bagaimana?
game-theory
behavioral-economics
bounded-rationality
Amogha Varsha
sumber
sumber
Jawaban:
Saya tidak yakin game alokasi kapasitas apa yang Anda lamar dengan QRE. Tapi inilah contoh yang sangat bergaya di mana QRE diterapkan pada permainan asimetris di mana ruang strategi dari dua pemain (nominal) berbeda: \ begin {array} {c | cc} & amp; L & amp; R \ hline T & amp; 1,0 & amp; 0,9 \\ D & amp; 0,1 & amp; 1,0 \ end {array} Game ini dapat dengan mudah direpresentasikan dalam bentuk yang luas juga.
Dalam perumusan standar QRE, setiap pemain $ i $ memainkan strategi campuran $ \ sigma_i $, di mana probabilitas strategi murni $ s_i $ dimainkan ditentukan oleh rumus berikut: \ begin {align} \ sigma_i (s_i) & amp; = \ frac {\ exp (\ lambda u_i (s_i, \ sigma _ {- i}))} {\ sum_ {s_i '\ dalam S_i} \ exp (\ lambda u_i (s_i', \ sigma _ {- i}))}, \ end {align} di mana $ \ lambda \ in [0, \ infty) $ mengukur ketepatan respons; semakin besar $ \ lambda $ semakin tepat responsnya.
Menerapkan permainan di atas, misalkan $ p $ menjadi probabilitas bahwa pemain 1 memilih $ T $, dan $ q $ probabilitas bahwa pemain 2 memilih $ L $. Perhatikan bahwa $ p $ dan $ q $ parameter masing-masing strategi campuran masing-masing pemain. Kemudian, pemain 1 respon kuantitatif untuk strategi campuran apa saja yang diberikan oleh pemain 2 (parameter oleh $ q $) adalah memainkan $ T $ dengan probabilitas $ p $ dan $ D $ dengan $ 1-p $, di mana \ mulai {persamaan} p = \ frac {\ exp (\ lambda \ cdot (1q + 0 (1-q)))}} cdot (0q + 1 (1-q)))}. \ tag {1} \ end {persamaan} Demikian pula, pemain 2 respon kuantitatif untuk strategi campuran apa pun yang diberikan oleh pemain 1 (parameter oleh $ p $) adalah memainkan $ L $ dengan probabilitas $ q $ dan $ R $ dengan $ 1-q $, di mana \ mulai {persamaan} q = \ frac {\ exp (\ lambda \ cdot (0p + 1 (1-p)))} {\ exp (\ lambda \ cdot (0p + 1 (1-p))) + \ exp (\ lambda \ cdot (9p + 0 (1-p)))}. \ tag {2} \ end {persamaan}
Di sebuah respon kuantitatif kesetimbangan , $ (\ sigma_1, \ sigma_2) $, strategi kedua pemain harus merupakan respons yang kuantitatif satu sama lain; itu adalah, \ begin {align} \ sigma_1 (T) & amp; = \ frac {\ exp (\ lambda \ cdot \ sigma_2 (L))} {\ exp (\ lambda \ cdot \ sigma_2 (L)) + \ exp (\ lambda (1- \ sigma_2 (L)))} & amp; \ sigma_1 (D) & amp; = 1- \ sigma_1 (T) \\ [12pt] \ sigma_2 (L) & amp; = \ frac {\ exp (\ lambda \ cdot (1- \ sigma_1 (T)))} {\ exp (\ lambda \ cdot (1- \ sigma_1 (T))) + \ exp (9 \ cdot \ lambda \ cdot \ sigma_1 (T))} & amp; \ sigma_2 (R) & amp; = 1- \ sigma_2 (L) \ end {align}
Dalam grafik berikut, garis putus-putus memplot respons terbaik dari masing-masing pemain; kurva padat mewakili respons kuantitatif di bawah berbagai tingkat presisi. Yaitu, persamaan kurva kurva padat $ (1) $ dan $ (2) $ di atas. Perpotongan dari dua kurva padat adalah titik kesetimbangan respons kuantitatif, yang dijelaskan oleh set terakhir persamaan di atas.
sumber