Komputer sudah lama bisa bermain catur menggunakan teknik "brute-force", mencari ke kedalaman tertentu dan kemudian mengevaluasi posisi. Namun komputer AlphaGo, hanya menggunakan JST untuk mengevaluasi posisi (itu tidak melakukan pencarian mendalam sejauh yang saya tahu). Apakah mungkin untuk membuat mesin catur yang memainkan catur dengan cara yang sama seperti AlphaGo memainkan Go? Kenapa tidak ada yang melakukan ini? Apakah program ini berkinerja lebih baik daripada mesin catur terbaik (dan pemain catur) hari ini?
32
Jawaban:
EDIT (setelah membaca makalah):
Saya sudah membaca koran dengan serius. Mari kita mulai dengan apa yang diklaim Google di koran:
Sayangnya, menurut saya itu bukan jurnal yang bagus. Saya akan menjelaskan dengan tautan (agar Anda tahu saya tidak bermimpi):
https://chess.stackexchange.com/questions/19360/how-is-alpha-zero-more-human memiliki jawaban saya tentang bagaimana AlphaZero bermain seperti manusia
Pertandingan itu tidak adil , sangat bias. Saya mengutip Tord Romstad, programmer asli untuk Stockfish.
Stockfish tidak bisa memainkan catur terbaik hanya dengan satu menit per gerakan. Program tidak dirancang untuk itu.
Tabel hash 1GB benar-benar tidak dapat diterima untuk pertandingan seperti ini. Stockfish akan sering menghadapi tabrakan hash. Dibutuhkan siklus CPU untuk mengganti entri hash lama.
KESIMPULAN
Google tidak membuktikan tanpa keraguan metode mereka lebih unggul dari Stockfish. Jumlah mereka dangkal dan sangat bias ke AlphaZero. Metode mereka tidak dapat direproduksi oleh pihak ketiga yang independen. Masih terlalu dini untuk mengatakan Deep Learning adalah metode yang unggul untuk pemrograman catur tradisional.
EDIT (Des 2017):
Ada sebuah makalah baru dari Google Deepmind ( https://arxiv.org/pdf/1712.01815.pdf ) untuk pembelajaran penguatan dalam catur. Dari abstrak, mesin catur Stockfish nomor satu dunia "secara meyakinkan" dikalahkan. Saya pikir ini adalah pencapaian paling signifikan dalam catur komputer sejak pertandingan Deep Blue 1997. Saya akan memperbarui jawaban saya setelah saya membaca kertas secara detail.
Asli (sebelum Des 2017)
Mari kita perjelas pertanyaan Anda:
JST dapat digunakan untuk mesin catur:
Giraffe bermain di tingkat Master Internasional, yaitu sekitar peringkat FIDE 2400. Namun, Stockfish, Houdini dan Komodo semuanya bermain sekitar FIDE 3000. Ini adalah kesenjangan yang besar. Mengapa? Mengapa tidak Pencarian Pohon Monte-Carlo?
Ada penelitian bahwa Pencarian Pohon Monte Carlo tidak skala baik untuk catur. Go adalah permainan yang berbeda dengan catur. Algoritma catur tidak berfungsi untuk Go karena catur bergantung pada taktik brutal. Taktik bisa dibilang lebih penting dalam catur.
Sekarang, kami telah menetapkan bahwa MCTS bekerja dengan baik untuk AlphaGo tetapi kurang untuk catur. Pembelajaran mendalam akan lebih bermanfaat jika:
Jika pembelajaran mendalam dapat mencapai hal-hal berikut, itu akan mengalahkan algoritma tradisional:
Biarkan saya tunjukkan:
satu lagi:
Referensi:
Saya mengutip:
sumber
DeepBlue telah mengalahkan Kasparov sehingga masalah ini diselesaikan dengan pendekatan yang lebih sederhana. Ini dimungkinkan karena jumlah gerakan yang dimungkinkan dalam catur jauh lebih kecil daripada saat berjalan , jadi itu adalah masalah yang jauh lebih sederhana. Terlebih lagi, perhatikan bahwa NN dan brute force membutuhkan sumber daya komputasi yang besar (di sini Anda dapat menemukan foto komputer di belakang AlphaGo, perhatikan bahwa ia menggunakan bahkan bukan GPU, tetapi TPU untuk perhitungan). Seluruh keributan dengan go adalah bahwa ketika Deep Blue mengalahkan Kasparov, komunitas go berpendapat bahwa ini tidak akan mungkin terjadi dengan go (karena banyak alasan berbeda, tetapi untuk meringkas argumen saya perlu memberikan pengantar rinci untuk permainan pergi). Ya, Anda dapat mengajar NN bermain catur, Mario , atau mencoba mengajarkannya bermainStarcraft ...
Saya kira alasannya adalah karena Anda tidak sering mendengar di media arus utama tentang kasus ketika orang memecahkan masalah yang sudah diselesaikan.
Selain itu premis Anda salah, Deep Learning yang digunakan untuk bermain catur, misalnya seperti yang dijelaskan dalam Jauh Belajar Mesin Mengajar Hakikat Catur di 72 Jam, Dimainkan di International Master Tingkat . Lihat juga makalah yang sesuai, Jerapah: Menggunakan Penguatan Dalam Pembelajaran untuk Bermain Catur .
sumber