Aplikasi MCTS / UCT

10

MCTS / UCT adalah metode pencarian tree game yang menggunakan algoritma bandit untuk memilih node yang menjanjikan untuk dijelajahi. Permainan dimainkan sampai selesai secara acak dan simpul yang mengarah ke lebih banyak kemenangan dieksplorasi lebih berat. Algoritme bandit menjaga keseimbangan antara penjelajahan simpul dengan tingkat kemenangan tinggi dan penjelajahan simpul yang tidak diketahui (dan dalam bentuk murni tidak perlu menggunakan fungsi evaluasi heuristik). Program-program yang didasarkan pada teknik umum ini telah mencapai hasil yang cukup luar biasa di komputer Go .

Apakah pencarian monte-carlo yang digerakkan oleh bandit telah diterapkan pada masalah pencarian lainnya? Misalnya, apakah itu akan menjadi pendekatan yang berguna dalam mendekati solusi untuk MAX-SAT, BKP, atau masalah optimasi kombinatorial lainnya? Adakah karakteristik masalah tertentu (struktural / statistik / dll.) Yang akan menyarankan apakah pendekatan gaya bandit akan efektif atau tidak?

Adakah masalah deterministik yang diketahui yang akan benar-benar tahan terhadap metode bandit, karena sifat ruang solusi?

madley
sumber

Jawaban:

7

Ini bukan jawaban yang lengkap, tetapi beberapa pengamatan dasar tentang penerapan ini pada MAX-SAT.

7/8x=0x=1x=0x=17/87/8

7/8NP7/8heuristik yang Anda gunakan, bahkan jika Anda menebak dengan sempurna, masih ada rumus yang tidak memuaskan yang hanya mengulangi akan menyimpulkan mereka tidak memuaskan setelah banyak langkah secara eksponensial. Batas bawah pada panjang bukti resolusi menghasilkan hasil ini. Salah satu referensi adalah:

Pavel Pudlák, Russell Impagliazzo: Batas bawah untuk algoritma DLL untuk k-SAT (versi awal). SODA 2000: 128-136

Ryan Williams
sumber
2

Makalah survei terbaru ini mencantumkan aplikasi MCTS ke sejumlah masalah pencarian dan optimisasi selain game, di Bagian 7.8:

http://pubs.doc.ic.ac.uk/survey-mcts-methods/survey-mcts-methods.pdf

http://ieeexplore.ieee.org/xpl/freeabs_all.jsp?arnumber=6145622

Adapun domain yang benar-benar tahan terhadap metode berbasis bandit, saya tidak mengetahui adanya masalah. Catur adalah salah satu penghilangan mencolok dari literatur MCTS, mungkin karena "status jebakan" yang mengganggu pencarian, tetapi juga mungkin karena fakta bahwa pemain Catur komputer sangat dioptimalkan dan bagus akhir-akhir ini sehingga setiap pendekatan baru tidak mungkin dilakukan lekuk pada mereka.

Salam, Cameron

Cameron Browne
sumber