Mengapa para pakar Catur terkejut dengan kemenangan AlphaZero melawan Stockfish?

10

Baru- baru ini menarik perhatian saya bahwa para ahli Catur mengambil hasil dari pertandingan yang sekarang terkenal ini sebagai sesuatu yang mengecewakan.

Lihat: Pemain Terbaik Baru Chess Adalah Algoritma Swashbuckling Yang Tak Takut

Sebagai non-pakar Catur dan Catur AI, asumsi saya adalah bahwa, berdasarkan kinerja AlphaGo, dan validasi jenis metode itu dalam kaitannya dengan permainan kombinatorial, adalah bahwa AI yang lebih tua tidak akan memiliki peluang.

  • Mengapa kemenangan AlphaZero mengejutkan?
DukeZhou
sumber

Jawaban:

14

Pertanyaan bagus.

Pertama dan terpenting adalah bahwa dalam Go deepmind tidak memiliki lawan manusia super untuk menantang. Mesin Go tidak berada di dekat level tertinggi pemain manusia top. Dalam catur, bagaimanapun, mesin adalah 500 poin ELO lebih kuat dari pemain manusia terbaik. Ini perbedaan besar. Jumlah pekerjaan yang masuk ke mesin catur kontemporer sangat mengejutkan. Kita berbicara tentang jutaan jam dalam pemrograman, ratusan ribu iterasi. Ini adalah kumpulan besar pengetahuan dan pekerjaan. Untuk mengatasi dan melampaui semua itu dalam 4 jam sangat mengejutkan.

Kedua, ini bukan hasil yang mengejutkan bagi master catur, melainkan bagaimana AlphaZero bermain catur. Sangat ironis bahwa sistem yang tidak memiliki pengetahuan atau keahlian manusia paling banyak dimainkan seperti yang kita lakukan. Mesin terkenal karena memainkan gerakan yang terlihat jelek, yang kurang harmonis, dll. Sulit dijelaskan kepada pemain non-catur tetapi ada yang namanya "gerakan buatan" seperti yang sering muncul pada mesin kontemporer. AlphaZero tidak bermain seperti ini sama sekali. Ini memiliki gaya yang sangat mirip manusia di mana ia mendominasi potongan lawan dengan permainan strategis yang mendalam dan pengorbanan posisi yang menakjubkan. AlphaZero memainkan cara yang kami cita-citakan, menggabungkan pemahaman posisi yang mendalam dengan ketepatan perhitungan mesin.

Sunting Oh dan saya lupa menyebutkan sesuatu tentang hasilnya itu sendiri. Jika Anda tidak terbiasa dengan catur komputer, hal itu mungkin tidak mengejutkan, tetapi memang demikian.

Hari-hari ini margin kemenangan yang memisahkan mesin-mesin kontemporer top adalah pisau cukur yang tipis. Dalam 100 pertandingan pertandingan, Anda bisa mengharapkan hasil seperti 85 pertandingan seri, 9 kemenangan, dan 6 kekalahan untuk menentukan mesin yang lebih baik.

AlphaZero 28 menang dan 72 kali imbang tanpa kerugian sama sekali menghancurkan dan benar-benar tidak terpikirkan hingga saat itu terjadi.

Chris D
sumber
Jawaban bagus. Poin Anda tentang perbandingan antara Catur re AI menarik dalam hal batasan berdasarkan kelincahan Catur dan triad Win / Loss / Draw. (Mungkin, di masa depan, kita akan membutuhkan game yang terbatas, tidak bisa diselesaikan yang memungkinkan analisis lebih rinci dalam hal hasil.) Saya akrab dengan sejarah mesin Catur, dan sejumlah besar upaya dan pengetahuan manusia yang masuk ke dalamnya, tetapi konteks dari kurangnya kesuksesan adalah: 19x19 Go yang jauh lebih kompleks memiliki konsekuensi yang berlawanan dengan saya.
DukeZhou
Secara khusus, asumsi saya adalah bahwa jika AlphaGo bisa mengalahkan manusia top dalam game yang jauh lebih kompleks, tampaknya masuk akal bahwa itu tidak hanya mengalahkan manusia top, tetapi AI sebelumnya teratas di game lain.
DukeZhou
Sedikit tentang gerakan artifisial sangat penting, dan bukan sesuatu yang saya lihat dibicarakan oleh pemain non-catur. +1
Stella Biderman
4

MCTS untuk catur telah dicoba dalam literatur dengan sedikit keberhasilan. Diasumsikan pendekatan AlphaGo tidak akan pernah bekerja pada catur, mungkin dalam Go tetapi tidak dalam catur. Tiba-tiba, Google mengumumkan bahwa pendekatan itu berhasil dan mengalahkan program catur terkuat di dunia dengan selisih yang sangat signifikan.

Sebelum Google, semua programmer catur diajari membuat heuristik dalam pemrograman mesin adalah strategi yang lebih baik daripada pembelajaran mesin. Tidak peduli bagaimana Anda menerapkan jaringan saraf, itu tidak akan pernah berjalan lebih cepat daripada sekelompok instruksi 64-bit. AlphaGo berjalan cukup lambat , tetapi memainkan catur terkuat.

Halo Dunia
sumber
2

Saya melihat, berdasarkan artikel yang Anda berikan, banyak tingkat kejutan dalam kemenangan:

Catur adalah permainan yang sulit untuk dikuasai dan bagian lawannya memiliki praktik terbaik dunia, AlphaZero memiliki tabula rasa.

Belajar butuh empat jam dan AlphaZero tidak kalah dengan 100.

Gaya bermain adalah campuran alien dari manusia dan komputer seperti gerakan, agresif dan kadang-kadang tampak konyol dengan pengorbanan yang tidak tahu tetapi sebenarnya membuat status masa depan lebih kuat.

Jumlah kemungkinan yang diperhitungkan per gerakan kurang dari bagian counter, AlphaZero memiliki firasat atau intuisi misterius.

Perasaan kesal datang dari jumlah materi pelatihan yang telah dibuat AlphaZero sendiri dan batas waktu, yang mungkin tidak memberikan waktu yang cukup pada mesin tradisional.

mico
sumber
Aaah. Jadi itu berasal dari kurangnya kepercayaan pada metode AI baru. Itu masuk akal.
DukeZhou