Rasionalitas terikat dengan model Ekuilibrium Respons Kuantal untuk game Form ekstensif

5

Saya sedang mengerjakan tesis Master saya berdasarkan rasionalitas terbatas dalam model teori permainan perilaku, saya ingin tahu apakah QRE (Quantal Response Equilibrium) dapat diterapkan ke permainan di mana pemain memiliki set strategi yang berbeda dengan apa yang telah saya lihat dalam permainan alokasi sumber daya , jika ya, bagaimana?

Amogha Varsha
sumber
1
Hai! Selamat datang di Econ.SE! Apa itu EFG? Mungkin sebaiknya tidak menggunakan akronim dalam judul pertanyaan. Bahkan jika itu membuat judulnya panjang, itu mungkin perbaikan. Semoga beruntung dengan tesis Anda!
jmbejara
Maksudmu luas bentuk game, seperti di pohon game?
Herr K.
Hei! ya, tepat sekali! tapi solusi apa pun yang saya lalui sebagian besar untuk permainan alokasi kapasitas di mana set aksi untuk semua pemain adalah sama. Saya ingin menerapkannya untuk skenario penyerang vs bek di mana strategi berbeda untuk setiap pemain
Amogha Varsha

Jawaban:

2

Saya tidak yakin game alokasi kapasitas apa yang Anda lamar dengan QRE. Tapi inilah contoh yang sangat bergaya di mana QRE diterapkan pada permainan asimetris di mana ruang strategi dari dua pemain (nominal) berbeda: \ begin {array} {c | cc} & amp; L & amp; R \ hline T & amp; 1,0 & amp; 0,9 \\ D & amp; 0,1 & amp; 1,0 \ end {array} Game ini dapat dengan mudah direpresentasikan dalam bentuk yang luas juga.

Dalam perumusan standar QRE, setiap pemain $ i $ memainkan strategi campuran $ \ sigma_i $, di mana probabilitas strategi murni $ s_i $ dimainkan ditentukan oleh rumus berikut: \ begin {align} \ sigma_i (s_i) & amp; = \ frac {\ exp (\ lambda u_i (s_i, \ sigma _ {- i}))} {\ sum_ {s_i '\ dalam S_i} \ exp (\ lambda u_i (s_i', \ sigma _ {- i}))}, \ end {align} di mana $ \ lambda \ in [0, \ infty) $ mengukur ketepatan respons; semakin besar $ \ lambda $ semakin tepat responsnya.

Menerapkan permainan di atas, misalkan $ p $ menjadi probabilitas bahwa pemain 1 memilih $ T $, dan $ q $ probabilitas bahwa pemain 2 memilih $ L $. Perhatikan bahwa $ p $ dan $ q $ parameter masing-masing strategi campuran masing-masing pemain. Kemudian, pemain 1 respon kuantitatif untuk strategi campuran apa saja yang diberikan oleh pemain 2 (parameter oleh $ q $) adalah memainkan $ T $ dengan probabilitas $ p $ dan $ D $ dengan $ 1-p $, di mana \ mulai {persamaan} p = \ frac {\ exp (\ lambda \ cdot (1q + 0 (1-q)))}} cdot (0q + 1 (1-q)))}. \ tag {1} \ end {persamaan} Demikian pula, pemain 2 respon kuantitatif untuk strategi campuran apa pun yang diberikan oleh pemain 1 (parameter oleh $ p $) adalah memainkan $ L $ dengan probabilitas $ q $ dan $ R $ dengan $ 1-q $, di mana \ mulai {persamaan} q = \ frac {\ exp (\ lambda \ cdot (0p + 1 (1-p)))} {\ exp (\ lambda \ cdot (0p + 1 (1-p))) + \ exp (\ lambda \ cdot (9p + 0 (1-p)))}. \ tag {2} \ end {persamaan}

Di sebuah respon kuantitatif kesetimbangan , $ (\ sigma_1, \ sigma_2) $, strategi kedua pemain harus merupakan respons yang kuantitatif satu sama lain; itu adalah, \ begin {align} \ sigma_1 (T) & amp; = \ frac {\ exp (\ lambda \ cdot \ sigma_2 (L))} {\ exp (\ lambda \ cdot \ sigma_2 (L)) + \ exp (\ lambda (1- \ sigma_2 (L)))} & amp; \ sigma_1 (D) & amp; = 1- \ sigma_1 (T) \\ [12pt] \ sigma_2 (L) & amp; = \ frac {\ exp (\ lambda \ cdot (1- \ sigma_1 (T)))} {\ exp (\ lambda \ cdot (1- \ sigma_1 (T))) + \ exp (9 \ cdot \ lambda \ cdot \ sigma_1 (T))} & amp; \ sigma_2 (R) & amp; = 1- \ sigma_2 (L) \ end {align}

Dalam grafik berikut, garis putus-putus memplot respons terbaik dari masing-masing pemain; kurva padat mewakili respons kuantitatif di bawah berbagai tingkat presisi. Yaitu, persamaan kurva kurva padat $ (1) $ dan $ (2) $ di atas. Perpotongan dari dua kurva padat adalah titik kesetimbangan respons kuantitatif, yang dijelaskan oleh set terakhir persamaan di atas.

enter image description here enter image description here enter image description here

Herr K.
sumber
K, persamaan untuk σ1 (T) dan σ2 (L) saling bergantung satu sama lain, maka bagaimana Anda akan menghitung nilainya tanpa mengetahui nilai yang lain? Juga persamaan-persamaan ini tidak menunjukkan ketergantungan pada hasil strategi yang bertentangan dengan definisi dalam ungkapan pertama.
Amogha Varsha
1
@ AmoghaVarsha: Ekspresi yang saya berikan di posting adalah untuk titik keseimbangan (the E dalam QRE). Jika Anda ingin merencanakan respons kuantitatif secara umum (tanpa E ), lalu perlakukan $ \ sigma_2 (L) $ dalam ekspresi $ \ sigma_1 (T) $ sebagai variabel $ q $, dan $ \ sigma_1 (T) $ dalam persamaan terakhir sebagai $ p $. Untuk $ \ sigma_1 (T) $, Anda dapat memplotnya terhadap semua nilai yang mungkin dari $ q $, mis. $ [0,1] $, untuk mendapatkan fungsi respons kuantitatif pemain 1 ke strategi pemain 2 (campuran). Secara simetris sebesar $ \ sigma_2 (L) $. QRE terjadi ketika dua kurva respons kuantitatif bersilangan; yaitu, keseimbangan adalah a titik pasti .
Herr K.
1
@ AmoghaVarsha: Silakan lihat jawaban saya yang diedit.
Herr K.
1
@ AmoghaVarsha dengan dua pemain Anda memecahkan sistem dua persamaan untuk mendapatkan titik keseimbangan. Dengan n pemain Anda cukup memecahkan sistem persamaan, asalkan strategi masing-masing pemain dapat diparameterisasi oleh satu parameter tunggal.
Herr K.
1
@ AmoghaVarsha: Jika jumlah total strategi adalah 3, Anda dapat melakukannya dalam plot 3 dimensi. Jika ada lebih dari 3 strategi, maka pada dasarnya mustahil untuk memvisualisasikannya di dunia 3D tempat kita hidup. Selain itu, jika Anda memiliki pertanyaan spesifik tentang alat visualisasi, Anda harus mempostingnya sebagai pertanyaan terpisah alih-alih menanyakannya di sini di area komentar.
Herr K.