Kompleksitas permainan informasi parsial-negara terbatas

12

Diberikan permainan zero-sum informasi-informasi parsial deterministik dengan hanya banyak negara bagian,
yang kemungkinan hasilnya adalah [kalah, seri, menang] masing-masing dengan nilai [-1,0, + 1],
apa kompleksitas perkiraan nilai tersebut sebuah game secara aditif dalam ?ϵ

Secara khusus, saya tidak dapat menemukan algoritma apa pun untuk melakukan itu.
Sisa dari pos ini dikhususkan sepenuhnya untuk memberikan uraian
masalah yang lebih menyeluruh , jadi jika Anda sudah dapat mencari tahu apa arti pertanyaan di bagian atas
pos ini, maka tidak ada alasan bagi Anda untuk membaca sisa pos ini.

Diberikan mesin wasit dengan status , dengan status awal yang ditentukan , status yang pasangan skornya , state yang skor pasangannya adalah , dan status formulirs 0 s a [ - 1 , + 1 ] s b [ + 1 , - 1 ]{1,2,3,...,S}s0sa[1,+1]sb[+1,1]

[p1_info,p2_info,num_of_choices,player_to_move,next_state_table] mana:

  • player_to_move{1,2}
  • next_state_table adalah fungsi dari{1,2,3,...,num_of_choices}{1,2,3,...,S}
  • p1_info,p2_info,num_of_choices1

Ketika mesin dalam kondisi seperti itu:

  • mengirim ke Player_1 dan mengirim ke Player_2,p1_infop2_info
  • mengirimkan ke pemain yang ditunjukkan, menunggu elemen sebagai masukan dari pemain itu,num_of_choices{1,2,3,...,num_of_choices}
  • kemudian pergi ke keadaan yang ditunjukkan olehnext_state_table

Ketika mesin memasuki salah satu dari dua negara lainnya atau ,sasb

  • berhenti dengan pasangan skor negara bagian itu sebagai hasilnya

Ada permainan dua pemain alami: mesin wasit dimulai dalam keadaan , pemain memberikan input yang oleh mesin wasit, jika mesin wasit berhenti maka Player 1 mencetak nilai pertama dari pasangan output mesin dan Pemain 2 mencetak nilai kedua dari pasangan keluaran mesin, jika tidak, kedua pemain mencetak skor 0. s0=1





Apa kompleksitas dari masalah berikut ini?
Diberikan mesin wasit dan bilangan bulat positif N, menghasilkan bilangan rasional
yang (tambahnya) dalam 1 / N dari nilai permainan alami untuk Player 1.

Seperti yang disebutkan sebelumnya dalam pertanyaan ini, saya tidak dapat menemukan
algoritma apa pun untuk melakukan itu.

Marzio De Biasi
sumber
Apakah para pemain mengetahui struktur internal? Apa keuntungan dari memiliki informasi tambahan, sehingga memberikan lebih banyak gerakan yang mungkin?
domotorp
Iya. Ini memberi mereka ide yang lebih baik tentang keadaan saat ini.
Maaf tapi saya masih belum mengerti. Lalu mereka tahu struktur internal tetapi mereka tidak tahu di mana mereka saat ini? Harap jelaskan deskripsinya, saya yakin saya bukan satu-satunya yang tidak dapat memahami masalahnya.
domotorp
3
Apakah model Anda sama dengan "permainan stokastik berbasis turn-sum zero-sum dengan informasi parsial"?
Kristoffer Arnsfelt Hansen
1
@ Kristoffer: Tidak jelas (setidaknya bagi saya) bahwa model saya memungkinkan untuk mengkode probabilitas irasional, walaupun model saya sebaliknya setara dengan yang itu.

Jawaban:

6

CATATAN: algoritme yang saya anggap salah; Saya menghapusnya.

Satu hal yang perlu disadari adalah bahwa tidak masalah apakah permainan itu deterministik atau tidak. Untuk mengacak, wasit dapat meminta setiap pemain untuk berkontribusi acak nomor mod , dan kemudian menambahkan mereka. Sangat mudah untuk menunjukkan bahwa jika para pemain menggunakan strategi optimal mereka, jumlahnya adalah angka acak mod , yang kemudian dapat digunakan wasit untuk mengacak strateginya. Ini tidak terlalu meningkatkan jumlah status dalam game.pp

Untuk batas bawah pada kompleksitas, pertanyaan mendekati nilai dari permainan stochastic sederhana yang tidak diketahui berada di P . Menggunakan trik pengacakan yang saya berikan di atas, mudah untuk menulis permainan stokastik sederhana sebagai permainan wasit dengan tabel pencarian ukuran polinomial.

Peter Shor
sumber
Gagasan pengacakan itu (setidaknya, seperti yang Anda gambarkan) hanya dapat memberikan probabilitas rasional. Juga, definisi yang digunakan dalam dua makalah pertama yang Anda tautkan terlalu menyiratkan bahwa permainan mereka memiliki pohon permainan terbatas, sedangkan saya hanya memerlukan ruang keadaan terbatas (di mana "negara" tidak memasukkan sejarah permainan).
Anda benar ... bagian pertama dari jawaban saya salah. Biarkan saya menghapusnya. Saya cukup yakin bahwa mendekati nilai permainan stokastik sederhana tidak diketahui berada di P bahkan ketika semua koin membalik memiliki probabilitas 1/2.
Peter Shor
1

Dengan Teorema 3.1 dan IPS bukti ini menjadi satu arah,
untuk semua bilangan real , jika maka masalah janjiϵ0<ϵ

Input: permainan seperti yang dijelaskan dalam pertanyaan saya
harus menampilkan YA jika: nilai permainan untuk Pemain 1 lebih besar dari 1- harus menghasilkan TIDAK jika: permainan nilai untuk Player 1 kurang dariϵ
ϵ

tetap RE -hard bahkan ketika

player_to_move selalu 1 (yaitu, hanya 1 pemain yang dibutuhkan)
dan
s 0 ≠ s sebuah dan s suatu tidak dalam Range (next_state_table)
(yaitu, secara harfiah tidak mungkin bagi pemain untuk kehilangan)
dan
p1_info dan p2_info dan number_of_choices independen dari negara
(yaitu, satu- satunya umpan balik pemain adalah apakah ia baru saja menang)

.


sumber