Memilih topik penelitian menggunakan teori permainan

Pertanyaan teori permainan baru-baru ini membuat saya berpikir (ini bersinggungan, tentu saja): Apakah mungkin untuk secara efisien mengoptimalkan strategi pribadi untuk memilih pertanyaan penelitian untuk dikerjakan menggunakan teori permainan?

Untuk menuju formalisasi pertanyaan, saya akan membuat asumsi berikut (yang dinyatakan secara informal):

Saya sama-sama "menikmati" masalah tertentu yang tersedia untuk saya kerjakan (untuk menghindari jawaban "lunak" (dan benar!) Dari "Lakukan apa yang Anda suka!").
Saya mungkin atau mungkin tidak berhasil menemukan jawaban untuk masalah apa pun yang saya pilih untuk saya selesaikan. Untuk masalah apa pun, saya memiliki beberapa perkiraan tentang seberapa baik saya dalam memecahkan suatu masalah (setelah menginvestasikan waktu di dalamnya).
Tujuan saya adalah untuk memaksimalkan hasil ketika dievaluasi di garis bawah (melamar pekerjaan, melamar masa kerja, melamar beasiswa, dll.), Yang merupakan fungsi dari berapa banyak masalah yang saya selesaikan dan seberapa penting atau sulit masalah tersebut . Saya tidak memiliki gagasan yang jelas tentang imbalan tepat per masalah, tetapi saya dapat membuat perkiraan yang masuk akal.
Ada hubungan terbalik yang longgar antara masalah hasil dan kesulitan masalah. Pernyataan lain dari tujuan saya adalah untuk "mempermainkan" perbedaan (yaitu mencari "buah yang menggantung rendah").
Sebuah contoh dari masalah keseluruhan ini ditentukan oleh daftar pertanyaan penelitian (mungkin jumlahnya tidak terbatas), yang saya lampirkan dengan tegas (tanpa biaya komputasi; itu diberikan sebagai input) perkiraan nilai pertanyaan dan kesulitan pertanyaan. Saya memainkan game ini melawan musuh (orang yang mengevaluasi saya); alam memutuskan, mengingat kemungkinan saya memecahkan masalah yang diberikan, apakah saya menyelesaikannya dengan sukses setelah saya memilih untuk mencobanya.

Dalam upaya untuk benar-benar memformalkan apa yang terjadi (dan menghindari tanggapan yang tidak menarik atau argumentatif / diskusi), saya akan melihat masalah ini sebagai permainan bentuk luas dengan informasi yang tidak lengkap dengan set tindakan yang tak terbatas .

Pertanyaan : Saya menganggap game jenis ini tidak dapat dihitung secara efisien. Namun, apakah ada algoritma waktu polinomial untuk memaksimalkan hasil saya? Bagaimana dengan PTAS?

Atau, alternatifnya, apakah ada model teoritik permainan yang lebih akurat untuk masalah ini? Jika demikian, pertanyaan yang sama berlaku: Dapatkah saya (kurang-lebih) memaksimalkan hasil saya secara efisien? Jika ya, bagaimana caranya?

soft-question gt.game-theory Daniel Apon
sumber

Salah satu masalah potensial dengan merumuskan ini sebagai permainan adalah bahwa musuh Anda, orang yang mengevaluasi Anda, belum tentu bermain melawan Anda. Memang sering kali mereka ada di pihak Anda, dan hanya bersedia melihat Anda gagal jika Anda belum melewati persyaratan minimum. Musuh lain yang mungkin adalah semua peneliti lain , karena mereka mungkin bekerja (mungkin secara kolaboratif) pada masalah yang sama dan dengan demikian bekerja melawan Anda mencapai kesuksesan dengan mencoba mendapatkan hasil sebelum Anda melakukannya.

Dave Clarke

Untuk keperluan pertanyaan ini (saya ingin menghindari diskusi sebanyak mungkin jadi ini adalah pertanyaan yang bagus ...), mari kita asumsikan orang yang mengevaluasi saya benar-benar di bawah tekanan serius untuk memilih satu dan hanya satu individu terbaik untuk hadiah tertentu, jadi mereka bermusuhan. Juga, mari kita asumsikan bahwa "apa pun yang benar-benar orisinal hanya akan menjadi: asli", sehingga peneliti lain tidak menjadi perhatian serius. Saya (tentu saja!) Secara pribadi tertarik pada kemungkinan lain, tetapi saya pikir membiarkannya terbuka akan mengundang jawaban buruk. :)

Daniel Apon

Salah satu faktor dalam masalah yang mungkin pantas model yang berbeda: Evaluasi probabilitas keberhasilan / struktur hadiah per masalah yang saya pilih untuk dikerjakan.

Daniel Apon

R

$R$

T

$T$

r_{i}

$r_i$

P_{i} (t)

$P_i(t)$

t

$t$

Tentu saja, dalam kehidupan nyata, setiap pertanyaan yang Anda jawab membuka lebih banyak pertanyaan, yang tidak dapat Anda prediksi sebelumnya tetapi yang sangat mungkin lebih mudah dan / atau bernilai lebih dari sekumpulan pertanyaan yang Anda mulai, tetapi begitu Anda mulai membuat pohon strategi seperti ini kesempatan menemukan sesuatu yang menarik yang bisa Anda katakan tentang permainan turun secara dramatis.

Peter Shor

Saya akan mencoba menjawab pertanyaan Anda dengan mengusulkan model alternatif untuk pertanyaan itu. Saya biasanya mengajukan lebih banyak pertanyaan daripada yang saya jawab di sini, jadi saya harap Anda akan memaafkan jika jawaban saya tidak optimal, meskipun saya melakukan yang terbaik.

Saya pikir cara mengutarakan pertanyaan yang akan optimal agar teori permainan bermanfaat adalah dengan mengasumsikan skenario yang lebih kompetitif. Yaitu, perlu ada persaingan di antara berbagai aktor yang berbeda. Jadi, saya akan menganggap yang berikut:

Ada sejumlah besar namun terbatas n dari peneliti lain yang mencoba untuk mengejar set pertanyaan penelitian yang tersedia, yang saya sebut Q , yang Anda minati.
Setiap masalah penelitian didefinisikan oleh karakteristik berikut:
- Investasi waktu , atau saya , diperlukan untuk mencapai visibilitas apakah Anda akan dapat menyelesaikan masalah atau tidak
- Probabilitas keberhasilan , atau S , dalam memecahkan masalah; begitu Anda mencapai "momen kebenaran" dan telah menginvestasikan waktu yang cukup, Nature akan memutuskan secara acak apakah Anda akan dapat menyelesaikan masalah atau tidak.
- Manfaat untuk karier Anda , atau U (seperti dalam utilitas), asalkan kesuksesan tercapai
Masing-masing peneliti ini memiliki level yang berbeda dari jumlah berikut:
- Waktu yang tersedia untuk investasi dalam penelitian, t
- Bakat dalam penelitian, r
- Keterampilan interpersonal dan kualitas-kualitas penunjang karier lainnya, l (seperti yang disukai), yang akan menentukan seberapa baik peneliti akan memanfaatkan keberhasilan penelitian mereka untuk kemajuan karier mereka

Sekarang, dengan asumsi tidak ada kerja sama dalam masalah apa pun adalah mungkin, pertimbangkan apa yang akan saya sebut sebagai "permainan iterasi dinamis." Ini adalah game yang dimainkan berulang kali, tetapi sedikit berubah setiap kali dimainkan.

Biarkan M menjadi jumlah gerakan, atau belokan, dalam permainan. Manifestasi awal permainan dapat direpresentasikan sebagai daftar yang berisi setiap aktor (peneliti) dan setiap masalah yang bisa mereka selesaikan, di samping semua nilai yang terkait dengan masing-masing aktor dan setiap masalah yang saya sebutkan di atas. (Saya berasumsi, tentu saja, bahwa setiap peneliti tahu segalanya yang diketahui saat ini tentang semua masalah, dan tentang semua peneliti lain, menjadikan ini permainan informasi yang sempurna.)

Selama setiap iterasi permainan, aktor tertentu memilih pertanyaan penelitian untuk dikerjakan. Setiap aktor diizinkan untuk berganti pertanyaan kapan saja, dan jika masalah dipecahkan, manfaat untuk karier U akan turun menjadi 0 untuk semua pemain lain. Jika seorang pemain menginvestasikan waktu yang cukup dan gagal untuk menyelesaikan masalah, maka pemain tersebut dilarang mencoba untuk memecahkan masalah itu lagi ... meskipun pemain lain diperbolehkan untuk terus mengerjakan masalah, dan aktor lain mungkin dapat menyelesaikan itu berhasil. Permainan berakhir setelah semua giliran M telah diambil.

Setiap belokan yang peneliti telah pilih masalah akan menyebabkan pemain lebih dekat untuk mencapai "momen kebenaran," dan mungkin memecahkan masalah, izin Alam. Suatu masalah, setelah dipecahkan, menambah manfaat tertentu bagi karier peneliti berdasarkan pada l . Bakat penelitian memperbesar kemungkinan keberhasilan, sementara waktu luang menguatkan kemampuan untuk membuat kemajuan pada gilirannya.

Saya ragu bahwa ada algoritma waktu polinomial untuk menyelesaikan ini; Saya tidak melihat alasan mengapa para peneliti harus dibatasi untuk bermain ekuilibria murni strategi-Nash, sehingga masalahnya akan melibatkan strategi campuran Nash ekuilibria dan dengan demikian menjadi yang terburuk PPAD-lengkap, jika Anda mempertimbangkan "memecahkan masalah" berarti "menemukan sebuah Nash keseimbangan untuk masalah tersebut. " (Orang bisa membayangkan bahwa jika Anda adalah peneliti paling proaktif di sekitar, Anda dapat melanjutkan dan menghitung keseimbangan Nash favorit Anda dan kemudian memberi sinyal kepada semua pemain lain ... sehingga memberi Anda keyakinan bahwa tidak ada yang akan mengubah strategi dari strategi. profil yang Anda beri tanda.)

Bagaimanapun, ini adalah jawaban yang paling terlibat yang pernah saya posting. Saya harap setidaknya ada nilainya. Harap beri tahu saya jika ada yang memberi respons atau terhadapnya atau rekomendasi untuk memperbaikinya.

Philip White
sumber

Philip, terima kasih atas jawabannya! Ini adalah perspektif yang bagus tentang masalah; Saya bertanya-tanya: Bisakah Anda memikirkan cara untuk menambahkan gagasan "informasi parsial" ke dalam masalah sehingga tetap mempertahankan status kelengkapan PPAD-nya? Sesuatu untuk memodelkan fakta bahwa sebagai pemain dalam permainan ini, saya tidak perlu tahu apa yang dilakukan semua lawan saya (yaitu saya tidak memiliki pengetahuan yang sempurna tentang pertanyaan apa yang mereka pertimbangkan, dan kekuatan apa yang mereka yakini miliki di menjawab setiap pertanyaan)? Apakah menambahkan ini mempengaruhi kompleksitas penghitungan Ekuilibrium Nash? (Saya tidak tahu!)

Daniel Apon

@Daniel Apon: Terima kasih atas komentarnya! Saya tidak berpikir akan sulit untuk mengubah kondisi sehingga Anda tidak tahu apa yang lawan Anda lakukan, atau apa karakteristik mereka. Satu-satunya peringatan adalah, saya pikir bahwa jaminan keberadaan keseimbangan Nash hilang ketika Anda berurusan dengan permainan informasi yang tidak sempurna. Saya tidak tahu banyak tentang apa yang dikenal sebagai "game Stackelberg," tapi saya pikir itu mungkin relevan dengan perubahan yang Anda usulkan. Saya sebenarnya bertanya-tanya apa konsep solusi terbaik dalam permainan informasi yang tidak sempurna ... Saya akan memikirkannya.

Philip White

Saya membaca sedikit lebih banyak tentang ini ... Saya pikir game Bayesian mungkin relevan di sini, karena mereka digunakan untuk menangani game dengan informasi yang tidak sempurna. Berikut ini tautan ke halaman Wikipedia yang saya lihat: en.wikipedia.org/wiki/Bayesian_game

Philip White

Memilih topik penelitian menggunakan teori permainan

Jawaban: