Properti submodularity dalam permainan kemacetan?

15

Biarkan menjadi permainan pemain dan elemen kemacetan .n mGnm

Untuk keseimbangan , dilambangkan dengan SUP (e) \ triangleq <sup_1 (e), sup_2 (e), \ ldots, sup_n (e)>e

SUP(e)≜ <skamuhal1(e),skamuhal2(e),...,skamuhaln(e)>

Di mana skamuhalsaya(e) berisi dukungan dari pemain ke - saya bermain e (serangkaian strategi yang saya mainkan dengan probabilitas positif).

Juga, kita mengatakan bahwa SUP(e)SUP(e) iff saya[n]:skamuhalsaya(e)skamuhalsaya(e) , yaitu setiap pemain di e mengacak tindakannya pada subset tindakan dia bisa memilih bermain e .

Satu definisi terakhir adalah biaya sosial, SC(e) yang didefinisikan sebagai jumlah biaya untuk para pemain.

Biarkan e,e menjadi dua (mungkin campuran) bahwa keseimbangan untuk G .

Apakah

SUP(e)SUP(e)
menyiratkan
SC(e)SC(e)
?

BPR
sumber
Apakah Anda bermaksud mengatakan SC(e)SC(e) ? Secara intuitif, orang akan berpikir bahwa bermain keseimbangan konsentrasi di sekitar elemen lebih sedikit akan menyebabkan setiap elemen menjadi lebih padat.
mana
@Ubiquitous - Saya pikir justru sebaliknya. Setiap pemain terkonsentrasi pada elemen yang lebih sedikit, yang berarti bahwa lebih sedikit pemain yang memanfaatkan setiap elemen. Fakta bahwa setiap pemain sekarang memilih subset elemen, dan ini masih merupakan keseimbangan , mungkin berarti masyarakat memperolehnya (jika tidak, tampaknya pemain cenderung menyimpang kembali untuk menggunakan lebih banyak elemen).
RB
Tergantung pada fungsi biaya (penundaan). Permainan dalam pertanyaan tidak ditentukan secara lengkap, karena hadiah (biaya) tidak ada.
Sander Heinsalu

Jawaban:

2

Proposisi ini secara umum tidak benar . Orang dapat menunjukkan bahwa itu benar dalam kasus dan . Di sini, saya menunjukkan contoh penghitung ketika dan .m = 2 n = 3 m = 2n=2m=2n=3m=2

Komentar singkat. Kita dapat mengulangi pertanyaan dengan kata-kata: apakah keseimbangan Nash yang "lebih acak" ( versus ) kurang efisien? Secara intuitif, ketika strategi yang lebih beragam dimainkan, hasil yang diwujudkan lebih acak dan bisa sangat tidak efisien karena kurangnya koordinasi antara agen. Ketika agen memainkan strategi murni, kita dapat berpikir bahwa kita mengurangi masalah koordinasi mengingat kita mempertimbangkan Nash equilibria. Intuisi ini tidak berlaku jika proposisi salah, karena saya akan tunjukkan ketika dan . e n = 3 m = 2een=3m=2

Sebutkan dan dua tindakan yang mungkin. Fungsi penundaan didefinisikan sebagai berikut: , , dan , , . Ini berarti bahwa ketika agen memainkan (resp. ), mereka menerima imbalan (resp. ). Ini adalah permainan kemacetan (simetris) selama fungsi penundaan meningkat.B d A ( 1 ) = 5 d A ( 2 ) = 7 d A ( 3 ) = 10 d B ( 1 ) = 1 d B ( 2 ) = 6SEBUAHBdSEBUAH(1)=5dSEBUAH(2)=7dSEBUAH(3)=10dB(1)=1dB(2)=6x A B - d A ( x ) - d B ( x )dB(3)=7xSEBUAHB-dSEBUAH(x)-dB(x)

Mendefinisikan sebagai keseimbangan ketika 1 agen memainkan dan 2 agen bermain . Tentukan sebagai keseimbangan ketika 1 agen selalu memainkan , dan 2 lainnya memainkan dengan probabilitas dan dengan probabilitas . Ini memenuhi properti .A B e B AeABeBAB 1 - μ = 1 / 3 s u p ( e ) s u p ( e ' )μ=2/3B1μ=1/3sup(e)sup(e)

Pertama, kami menunjukkan bahwa adalah kesetimbangan Nash. Agen yang memainkan memaksimalkan imbalannya mengingat strategi dua pemain lainnya ketika memilih lebih baik daripada memilih , (yaitu ). Kedua agen yang bermain bermain secara optimal jika (yaitu ). dengan demikian adalah ekuilibrium Nash dan biaya sosialnya adalah .A A B d A ( 1 ) < d B ( 3 ) 5 < 7 B d B ( 2 ) < d A ( 2 ) 6 < 7 e d A ( 1 ) + 2 d B ( 2 ) = 17 = 153eAABdA(1)<dB(3)5<7BdB(2)<dA(2)6<7edSEBUAH(1)+2dB(2)=17=1539

Kedua, kami menunjukkan bahwa adalah kesetimbangan Nash. Di satu sisi, agen yang bermain memaksimalkan hadiahnya ketika dua lainnya bermain strategi campuran jika dia lebih baik bermain daripada , yaitu , yang benar. Di sisi lain, masing-masing agen yang memainkan strategi campuran tidak peduli antara memilih atau jika yaitu . B B A ( 1 - μ ) 2 d B ( 3 ) + 2 μ ( 1 - μ ) d B ( 2 ) + μ 2 d B ( 1 ) < ( 1 - μ ) 2 d A ( 1 ) + 2 μ ( 1 - μ ) d A ( 2eBBSEBUAH1

(1-μ)2dB(3)+2μ(1-μ)dB(2)+μ2dB(1)<(1-μ)2dSEBUAH(1)+2μ(1-μ)dSEBUAH(2)+μ2dSEBUAH(3)
ABμdA(2)+(1-μ)dA(1)=μdB(2)+(1-μ)dB(3)19195+497+4910<197+496+491SEBUAHB
μdSEBUAH(2)+(1-μ)dSEBUAH(1)=μdB(2)+(1-μ)dB(3)
193=193ekemudian adalah ekuilibrium Nash dan biaya sosialnya adalah yang sama dengan .
(1-μ)2[3dB(3)]+2μ(1-μ)[dSEBUAH(1)+2dB(2)]+μ2[2dSEBUAH(2)+dB(1)]
1921+4917+4915=1499

Akhirnya, kami telah menunjukkan bahwa tetapi . Ekuilibrium Nash strategi campuran menghasilkan biaya sosial yang lebih rendah daripada strategi murni.skamuhal(e)skamuhal(e)SC(e)>SC(e)

GuiWil
sumber