Pertanyaan yang diberi tag combinatorial-games

20

Bagaimana cara menangani gerakan yang tidak valid dalam pembelajaran penguatan?

Saya ingin membuat AI yang bisa memainkan lima-dalam-baris / gomoku. Seperti yang saya sebutkan dalam judul, saya ingin menggunakan pembelajaran penguatan untuk ini. Saya menggunakan metode gradien kebijakan , yaitu REINFORCE, dengan baseline. Untuk perkiraan nilai dan fungsi kebijakan, saya...

9

Beberapa keraguan tentang penerapan pembelajaran penguatan untuk permainan seperti catur

Saya menemukan permainan papan catur. Saya membangun mesin sehingga bisa bermain secara otonom. Mesin pada dasarnya adalah pohon keputusan. Ini disusun oleh: Fungsi pencarian yang di setiap node menemukan semua langkah hukum yang mungkin Fungsi evaluasi yang memberikan nilai numerik ke posisi...

reinforcement-learning game-ai game-theory combinatorial-games negamax

9

Jaringan saraf vs Algoritma genetika dalam game seperti Tic Tac Toe?

Saat ini saya sedang melakukan proyek yang tentang membuat AI untuk memainkan game Gomoku (Ini seperti tic tac toe, tetapi dimainkan di papan 15 * 15 dan membutuhkan 5 berturut-turut untuk menang). Saya telah berhasil mengimplementasikan AI tic tac toe sempurna menggunakan pembelajaran Q dan...

neural-networks machine-learning genetic-algorithms combinatorial-games