AI catur murni yang dilatih sendiri

46

Sejauh yang saya mengerti, tampaknya, sebelum pindah, semua perangkat lunak catur kuat

memeriksa ribuan atau jutaan kemungkinan, posisi masa depan;
mengevaluasi setiap posisi masa depan sesuai dengan beberapa heuristik, yang disebut fungsi evaluasi;
secara terpisah mengevaluasi setiap posisi masa depan untuk ketenangan, untuk memutuskan apakah akan mengeksplorasi kelanjutan dari posisi tersebut;
memilih dari antara langkah-langkah yang tersedia dengan minimax; dan
menggunakan buku pembuka.

Sejauh ini bagus. Namun, kekuatan program catur tampaknya sebagian besar bergantung pada kualitas evaluasi dan heuristik diamnya - dan juga pada buku pembuka yang, dari sudut pandang komputer, adalah satu lagi heuristik. Program catur semacam itu rupanya, hanya, yang benar-benar tahu banyak tentang permainan seperti halnya manusia yang telah membuat heuristik. Program itu tampaknya tidak memiliki wawasannya sendiri.

Adakah yang pernah menulis program catur yang memiliki wawasannya sendiri? Itu mempelajari gamenya sendiri? Itu melatih dirinya sendiri? Program seperti itu akan dilengkapi dengan aturan permainan, tentu saja, dan mungkin akan lebih jauh diberikan dengan minimax mentah dan infrastruktur diam, dan akan dapat mengenali dan menuntut pasangan yang dipaksa jika menemukan satu. Namun, itu tidak akan diberikan heuristik. Sebagai contoh, tidak akan disuruh membuka permainan menuju pusat, atau untuk lebih memilih benteng untuk ksatria, atau apa pertahanan Sisilia. Itu harus menyimpulkan prinsip-prinsip seperti itu (atau, mungkin, untuk menemukan prinsip-prinsip yang lebih baik) sendiri.

Dalam bentuknya yang murni, program semacam itu tidak akan pernah disediakan game master untuk dipelajari, tetapi hanya gamenya sendiri, yang dimainkan melawan dirinya sendiri. Hanya sekali dilatih sendiri sepenuhnya akan dilepaskan pada kompetisi manusia.

Apakah AI catur murni seperti itu ada? Pernahkah autodidak catur mekanik muncul? Memang, bisakah orang Turki tua itu belajar sendiri?

Di sini tampaknya ada pemberitahuan singkat tentang AI catur murni yang gagal.

( Pertanyaan terkait tangensial sebelumnya telah muncul di situs ini, mengenai studi komputer tentang pembukaan catur.)

MEMPERBARUI

Pertanyaan ini dianugerahi oleh tiga jawaban berbeda yang menerangi pada saat penulisan ini, oleh @WesFreeman, @GregE. dan @Landei. Ketiganya sangat direkomendasikan dan saya akan merasa bersalah ketika, menurut kebijakan situs, saya secara resmi menerima satu dengan mengesampingkan yang lain. Biarkan saya di sini mengucapkan terima kasih dan menyatakan penghargaan saya untuk ketiganya.

Pertanyaan ingin singkat. Namun respons terhadap jawaban mungkin berjalan lebih lama. Karenanya, pembaca yang tertarik dapat langsung beralih dari sini ke jawaban dan kemudian, jika masih berminat, dapat kembali membaca pembaruan yang lebih panjang yang mengikutinya.

Ketika saya mengajukan pertanyaan, saya memikirkan sesuatu seperti yang berikut.

Misalkan sebuah desa hipotetis di pinggiran Shangri-La di mana orang tidak pernah mendengar catur. Selama kunjungan singkat Anda, Anda mengajari para tetua desa aturan permainan, tetapi tidak pernah menginstruksikan mereka dalam salah satu prinsip permainan. Dua dari penatua memainkan permainan seperti yang ditonton oleh para penatua, sementara Anda (tidak ingin mengganggu permainan dengan kibitzing) membatasi komentar Anda pada pertanyaan aturan. Tidak ada postmortem yang mengikuti permainan, catur juga tidak dimainkan atau dibahas lagi saat Anda tetap di Shangri-La. Namun, ketika Anda pergi, tidak pernah kembali, Anda meninggalkan catur Anda.

Dalam ketidakhadiran Anda, para penatua mengajarkan permainan kepada orang-orang. Beberapa orang kemudian bermain sedikit selama waktu senggang, beberapa dengan antusiasme yang tumbuh, yang membuat set catur mereka sendiri.

Mungkin tidak segera jelas bagi penduduk desa bahwa benteng lebih baik daripada ksatria, tetapi orang-orang mungkin secara bertahap masih mengusahakan kekuatan relatif dari bidak catur atas permainan banyak permainan. Demikian juga, mungkin tidak segera jelas bagi mereka bahwa 1. a4 adalah pembukaan yang buruk: mereka bisa tetapi mencobanya dan mempertimbangkan hasilnya.

Sampai sejauh mana pemahaman penduduk desa tentang permainan pada akhirnya akan menyatu dengan dunia luar? Karena tidak memiliki buku pembuka, dapatkah mereka mengembangkan bukaan novel sendiri? Tentu saja, orang tidak akan berharap pembukaan desa menjadi sangat baik pada awalnya, tetapi, setelah beberapa abad terisolasi, penduduk desa mungkin mengembangkan repertoar pembukaan yang terhormat, untuk yang saya tahu.

Akankah salah satu dari bukaan mereka, dikembangkan secara independen, terbukti menarik bagi dunia luar, ketika pelancong berikutnya melintas untuk mencatatnya, 200 tahun kemudian? Mungkinkah Shangri-La memberi dunia baru, novel, Shangri-La Defense?

Jika demikian, maka, sehubungan dengan pertanyaan awal saya tentang catur AI, apa yang ada dalam pikiran saya kurang lebih ini: bisakah seorang catur catur lebih atau kurang meniru kemajuan catur penduduk desa di pinggiran Shanrgi-La?

Mengingat kisah Sussman dalam jawaban @ Landei di bawah ini, tidak diragukan lagi benar bahwa penduduk desa saya akan membawa prasangka tertentu ke permainan. Sebagai contoh, mereka akan membawa pemahaman bahwa memiliki lebih banyak hal yang bermanfaat pada umumnya lebih baik daripada memiliki lebih sedikit dari itu, dan karena itu untuk menangkap bidak catur lawan mungkin, biasanya lebih baik daripada menderita penangkapan sendiri. Seberapa teritorial orang-orang fiksi Shangri-La pada dasarnya adalah pertanyaan untuk sastra, tetapi orang dapat berasumsi bahwa mereka akan mengenali posisi yang memerintahkan lebih banyak ruang sebagai lebih unggul daripada posisi yang kurang diperintahkan. Dan setiap pemula yang cerdas, sekali ditunjukkan set catur dan diinstruksikan dalam aturan permainan, dapat menyimpulkan bahwa seorang ratu mungkin lebih baik daripada pion, hanya dengan itu ratu memiliki hingga 27 langkah yang tersedia,

Pertanyaan saya karena itu tidak perlu ditafsirkan untuk menyiratkan perintah mutlak, gaya Sussman terhadap membawa segala jenis pengetahuan apa pun ke papan catur; melainkan untuk menyiratkan perintah umum terhadap pengetahuan khusus catur yang sudah terbentuk sebelumnya. Setelah semua (mengabaikan masalah evolusi aturan permainan lama), pada suatu waktu di masa lalu, permainan catur pertama kali dimainkan. Mungkin pemain pertama membuka 1. a4; tetapi akhirnya dia belajar lebih baik, dan mengajarkan apa yang telah dia pelajari kepada murid-muridnya; yang pada gilirannya belajar lebih banyak dan mengajar lebih banyak, dari generasi ke generasi, untuk memberi kita Kasparov.

Mungkinkah AI tidak melakukan hal seperti itu, hanya dalam beberapa minggu dan bukan abad?

Plato akan skeptis, saya kira. Hume akan lebih optimis, tetapi pertanyaannya tidak lagi diselesaikan oleh filsafat saja. Kami memiliki komputer elektronik sekarang untuk menguji proposisi, dan saya bertanya-tanya apa keadaan seni AI itu. AI catur terbaik saat ini tampaknya benar-benar sistem pakar yang tidak cerdas yang mengalahkan semua orang sambil tidak menghasilkan apa-apa. Saya bertanya-tanya apakah AI yang sedikit lebih luas yang, dalam beberapa hal, benar-benar berpikir tentang catur, telah cukup berhasil dalam mengajar diri mereka sendiri permainan.

Saya berpendapat bahwa jawabannya adalah tidak, mungkin tidak.

engines thb
sumber

4

Ini adalah salah satu pertanyaan yang lebih baik di situs ini, sungguh.

prusswan

5

Sepertinya jawabannya sekarang ya karena DeepMind baru saja merilis penelitian tentang keadaan baru seni catur AI yang telah mereka latih dari awal (hanya permainan mandiri, tidak ada permainan referensi). arxiv.org/pdf/1712.01815.pdf

Lalaland

1

Menambahkan pada komentar @Lalaland, setelah pelatihan untuk saya pikir 10 jam itu benar-benar menghancurkan stockfish (tidak yakin versi mana) seolah-olah stockfish adalah seorang pemula. Cukup banyak yang belum pernah terdengar di game engine vs engine. Sepertinya alphago zero suka memainkan dalam gaya Tal

Ariana

2

"Bisakah seorang AI melakukan hal seperti ini dalam hitungan minggu, bukan abad? Mungkin tidak." Ya, Anda benar ... Hanya butuh berjam-jam.

user230452

1

Cukup banyak pemain, seperti Capablanca, yang seharusnya menemukan permainan dengan melihatnya dimainkan sekali. Dan ingat bahwa Alpha Zero tidak memiliki hal lain untuk dipikirkan.

Philip Roe

26

Anda memiliki beberapa poin yang sangat menarik. Saya memiliki sedikit pengalaman dalam penelitian AI (M.Sc. saya berada di bidang ini), jadi saya pikir saya dapat memberikan beberapa wawasan.

Telusuri kembali di area tersebut

Pertama, penelitian dalam bidang ini benar-benar terjadi - mencari "catur pendekatan evolusi" muncul dengan makalah ini dari tahun 2001, melakukan hampir semua yang Anda sarankan, meninggalkan pendekatan min / max dan hanya memodifikasi fungsi evaluasi. Mungkin untuk menggali lebih banyak lagi, dan saya mengetahui beberapa orang yang bekerja di bidang ini secara umum.

Kemungkinan teoretis

Menurut pendapat saya, satu-satunya faktor pembatas nyata untuk penciptaan "murni" catur yang bermain AI adalah waktu komputasi. Sama sekali tidak ada alasan mengapa AI seperti itu tidak dapat dibuat secara teoritis menggunakan pendekatan saat ini.

Kepraktisan

Ada dua masalah utama dengan menggunakan pendekatan evolusi atau genetik dalam mengembangkan fungsi heuristik catur, yang pertama adalah bahwa bahkan pada dasarnya, fungsi heuristik untuk catur sangat kompleks. Kita berbicara ratusan aturan, penilaian sepotong (yang mungkin berbeda berdasarkan posisi, dll), analisis posisi, dll. Anda akan memerlukan bahasa komputer yang fleksibel untuk menjelaskan aturan ini, dan kemudian aturan ini dapat dibuat secara acak, bermutasi, berkembang biak satu sama lain, dll. Ini tentu saja mungkin, tetapi saya kira Anda akan berakhir dengan seperangkat aturan yang terdiri dari beberapa ribu entitas. Itu aturan yang sangat besar yang diatur untuk berkembang secara dinamis.

Masalah kedua adalah bahwa untuk benar-benar mengevaluasi aturan yang baru Anda modifikasi, Anda harus memainkan permainan catur, dan melihat siapa yang akhirnya menang. Jika Anda ingin melakukan ini dengan "benar", Anda harus memberi kedua pemain banyak waktu untuk berpikir, sesuatu yang mirip dengan panjang permainan yang umum. Namun, bermain hanya dengan satu lawan saja tidak cukup, Anda ingin memainkan banyak lawan yang berbeda, dan mungkin bahkan lawan yang sama, berkali-kali, sebelum Anda benar-benar yakin bahwa Anda telah menemukan peningkatan dalam kekuatan permainan. Ini mungkin berarti bermain beberapa ratus game per individu dalam populasi Anda, dan itu memberi Anda satu generasi algoritma Anda.

Biasanya dengan jenis pendekatan ini, Anda akan melihat setidaknya beberapa ratus generasi, atau dengan fungsi rumit seperti heuristik catur, beberapa ratus ribu (atau bahkan jutaan) generasi. Beberapa matematika cepat harus meyakinkan Anda bahwa Anda akan memerlukan beberapa ribu jam waktu CPU untuk satu generasi, bahkan untuk mengecilkan server pertanian berukuran besar, Anda mungkin perlu beberapa (mungkin ratusan) tahun untuk benar-benar berkembang, persis seperti Anda sebutkan di pembaruan Anda.

Pada akhir waktu itu, Anda akan memiliki algoritma yang menarik yang mungkin akan memiliki banyak wawasan tentang permainan yang belum pernah benar-benar ditemukan. Sulit untuk mengatakan apakah itu berguna atau bahkan dapat dimengerti oleh manusia. Mengapa aturan ini ada? Karena lebih dari beberapa ribu permainan, sepertinya berhasil.

Masa depan

Saya tidak ragu bahwa pendekatan ini akan mendapatkan lebih banyak popularitas, karena daya komputasi meningkat. Saat ini, kami berada pada titik di mana mesin memiliki waktu komputasi yang cukup untuk mengalahkan (hampir semua) manusia, jika kecerdasannya dibuat dengan cermat. Dalam waktu 20 tahun, sangat mungkin bahwa prosesor akan bergerak sangat jauh sehingga satu atau dua gerakan ekstra tidak lagi memberikan manfaat yang cukup bagi mesin "hard-coded", tetapi secara rutin dikalahkan oleh mesin yang berevolusi, anehnya intuitif yang memiliki jutaan jam evolusi di belakang mereka.

Pembaruan 2018 Mei

Seperti yang dikatakan Robert Kaucher dalam komentar di bawah, berita terbaru layak disebutkan di sini. Secara khusus, proyek Google AlphaGo tampaknya menjadi pendekatan berbasis AI pertama yang benar-benar layak untuk jenis-jenis permainan ini, dan pada akhir 2017, mengklaim telah menang melawan StockFish 2 , setelah dirancang ulang untuk tugas tersebut.

Daniel B
sumber

Terima kasih. Saya perhatikan bahwa kertas yang Anda tautkan melatih AI-nya pertama melawan lawan manusia yang bukan penguasa dan kemudian melawan perangkat lunak catur yang masih ada, yang tidak persis seperti yang Anda dan saya pikirkan. Seorang Platonis seperti saya tidak akan terkejut mengetahui bahwa jenis AI yang Anda dan saya diskusikan adalah ketidakmungkinan praktis (kita tahu bahwa itu bukan ketidakmungkinan teoretis karena catur dapat diselesaikan secara teori dengan minimax); tetapi apakah jawaban mengejutkan saya bukan itu intinya. Intinya adalah bertanya apakah AI telah mencapai prestasi yang diusulkan. Jawabannya sepertinya tidak.

thb

2

@ THB saya pikir ada cukup banyak upaya pada jenis AI ini, meskipun Anda dapat menganggapnya "tidak berhasil". Saya menduga bahwa upaya yang sangat sukses (hari ini) mungkin akan bermain di level amatir yang sangat lemah; sebuah pencapaian besar, hanya saja tidak di mata publik. Juga, saya tidak berpikir pelatihan terhadap program yang ada dan manusia curang, per se - hanya optimasi yang sangat besar, meskipun yang mungkin mengubah arah gaya bermain AI yang sedang berkembang.

Daniel B

1

Jika Anda tertarik untuk membaca lebih lanjut tentang pendekatan "murni", Anda mungkin akan lebih beruntung mencari pendekatan "koevolusi kompetitif". Ini adalah ungkapan yang digunakan ketika tidak ada cara yang baik untuk memberikan ukuran kinerja eksternal (yaitu kita tidak bisa bermain melawan mesin catur lainnya), sehingga pelatihan AI harus berkembang dengan memainkan berbagai versi sendiri. Ini benar-benar bekerja, tetapi membutuhkan waktu lebih lama, yang mungkin mengapa itu pendekatan yang kurang dikejar.

Daniel B

1

@DanielB Apakah AlphaZero AI seperti itu?

Harry Weasley

1

Anda mungkin ingin memperbarui jawaban Anda. chess.com/news/view/…

Robert Kaucher

17

Saya menduga bahwa apa yang Anda tanyakan akan diklasifikasikan sebagai semacam algoritma genetika atau pendekatan algoritma evolusi . Saya menduga tidak ada cara realistis untuk merancang algoritma seperti itu tanpa secara intrinsik menanamkan beberapa derajat bias manusia pada tingkat fundamental, karena programmer masih harus mendefinisikan fitur statis dari suatu posisi (hitungan material, struktur gadai, kompleks warna, dll.) dimana AI akan mengklasifikasikan dan membandingkan posisi dari game yang berbeda. Jika Anda melakukan pencarian Google pada terminologi algoritmik di atas dalam konteks catur, Anda akan menemukan banyak hasil, tetapi mungkin sedikit dalam penelitian serius yang sebenarnya telah digunakan untuk membangun AI yang kompetitif dan kompetitif.

Faktanya adalah, sebagai konsekuensi dari hukum Moore, komputer sekarang adalah mesin penghitung yang sangat kuat sehingga metode AI yang sangat canggih tidak hanya tidak perlu (dalam hal bermain pada tingkat yang lebih tinggi dari lawan manusia terbaik), tetapi bahkan dapat dibayangkan menjadi kontra-produktif. Catur adalah jenis permainan di mana - terutama karena ruang pencariannya yang relatif kecil dari gerakan yang wajar dalam posisi apa pun dan adanya pemaksaan kombinasi taktis (terdiri dari urutan pemeriksaan, tangkapan sepotong, ancaman pasangan atau kehilangan materi yang sangat besar, dll.) - pendekatan brute-force dengan beberapa pemangkasan pohon pencarian konservatif secara simultan merupakan pendekatan yang paling sederhana secara algoritmik dan paling efektif. Jika Anda memperhitungkan ketersediaan tabel endgame dan buku pembuka, logika pendekatan itu hanya tumbuh. Saya mengerti bahwa ada sa masih banyak minat teoretis dan nilai potensial dalam jenis novel AI yang sedang Anda bicarakan, tetapi saya menduga catur adalah arena yang salah untuk mengembangkannya. Di sisi lain, permainan seperti Go, yang pada dasarnya kurang taktis dan mencakup ruang pencarian yang jauh lebih besar yang menjadikan pendekatan brute-force tidak praktis, mungkin menjadi kandidat yang lebih baik untuk penelitian mutakhir AI.

Greg E.
sumber

Saya telah memperbarui pertanyaan AI berdasarkan jawaban Anda. Pembaruan ini tidak singkat sehingga, sesuai pilihan Anda, ketika Anda punya waktu, Anda dapat memeriksanya sejauh yang menarik minat Anda.

thb

2

Tidak ada bias manusia yang dibutuhkan. Cukup hasilkan 1000 algoritma acak yang mampu bermain catur legal, gabungkan satu sama lain dalam sebuah turnamen, lalu ambil 20% teratas dan terapkan mutasi dan crossover untuk membangun generasi berikutnya. Ulangi di sejumlah populasi selama beberapa generasi dan Anda harus memiliki sesuatu yang setengah jalan pada akhirnya. Satu-satunya fungsi kebugaran yang dibutuhkan adalah menang / kalah.

superluminary

15

Lihat halaman Wikipedia tentang Bermain Game Umum . Ini adalah area penelitian aktif. Ada turnamen GGP tahunan di mana program diberi aturan permainan baru, bisa memikirkannya sebentar, dan kemudian mainkan permainan itu satu sama lain.

Jika Anda memberikan aturan catur ke program GGP, saya pikir Anda akan mendapati bahwa permainan catur lebih kuat daripada pemula manusia dan jauh lebih lemah daripada program catur yang ditulis khusus.

Jay Scott
sumber

13

Layak meninjau kembali pertanyaan ini mengingat keberhasilan AlphaZero baru-baru ini melawan Stockfish 8 . Evolusi lebih lanjut dari program DeepGoGo AlphaGo dan AlphaGo Zero, AlphaZero selesai dengan skor mengejutkan +28 = 72 -0 melawan salah satu mesin catur "tradisional" terkuat di planet ini.

AlphaZero belajar sendiri untuk bermain melalui pembelajaran penguatan, melatih arsitektur jaringan saraf melalui serangkaian game melawan dirinya sendiri. Menurut kertas terlampir :

Fitur input yang menggambarkan posisi, dan fitur output yang menggambarkan gerakan, disusun sebagai seperangkat bidang; yaitu arsitektur jaringan saraf disesuaikan dengan struktur grid papan.

AlphaZero dilengkapi dengan pengetahuan sempurna tentang aturan permainan. Ini digunakan selama MCTS, untuk mensimulasikan posisi yang dihasilkan dari urutan gerakan, untuk menentukan penghentian permainan, dan untuk mencetak setiap simulasi yang mencapai kondisi terminal.

Pengetahuan tentang aturan juga digunakan untuk menyandikan bidang input (yaitu castling, repetition, no-progress) dan output pesawat (bagaimana potongan bergerak, promosi, dan potongan tetes dalam shogi).

Jumlah tipikal langkah hukum digunakan untuk mengukur kebisingan eksplorasi (lihat di bawah).

Permainan catur dan shogi yang melebihi jumlah langkah maksimum (ditentukan oleh panjang permainan tipikal) diakhiri dan ditetapkan sebagai hasil seri; Permainan Go diakhiri dan dicetak dengan aturan Tromp-Taylor, mirip dengan pekerjaan sebelumnya (29).

AlphaZero tidak menggunakan segala bentuk pengetahuan domain di luar poin yang tercantum di atas.

Saya yakin orang dapat mengajukan pertanyaan tentang hal-hal seperti perangkat keras yang berbeda yang digunakan - " AlphaZero ... menggunakan mesin tunggal dengan 4 TPU . Stockfish ... dimainkan pada tingkat keterampilan terkuatnya menggunakan 64 benang dan ukuran hash 1GB. " - tetapi bagaimanapun juga hasil AlphaZero adalah yang luar biasa, dan sangat tergantung pada OP.

Mengungkap bahkan mungkin lebih banyak dukungan untuk seberapa sedikit pengetahuan khusus domain yang dimainkan, selain mengalahkan Stockfish dalam catur, AlphaZero juga dilatih di shogi hingga menjadi yang terbaik dalam program juara Elmo, dan tentu saja juga melampaui pendahulunya AlphaGo Zero in Go .

Berikut adalah salah satu pertandingan melawan Stockfish, Berlin di mana ketidakseimbangan materi akhirnya AlphaZero dengan pasangan uskup melawan ksatria dan 4 pion untuk Stockfish setelah 31.Qxc7. Dalam posisi itu, semua karya AlphaZero ada di peringkat belakang, dengan para uskup kembali di kotak aslinya. Pada akhirnya, setelah ratu keluar potongan hitam bermanuver perlahan untuk mengambil pion putih, dan itu tirai.

Stockfish - AlphaZero, 2017-12-04, 0-1

1. e4 e5 2. Nf3 Nc6 3. Bb5 Nf6 4. d3 Bc5 5. Bxc6 dxc6 6. OO Nd7 7. Nbd2 O-O 8. Qe1 f6 9. Nc4 Rf7 10. a4 Bf8 11. Kh1 Nc5 12. a5 Ne6 13. Ncxe5 fxe5 14. Nxe5 Rf6 15. Ng4 Rf7 16. Ne5 Re7 17. a6 c5 18. f4 Qe8 19. axb7 Bxb7 20. Qa5 Nd4 21. Qc3 Re6 22. Be3 Rb6 23. Nc4 Rb4 24. b3 a5 25. Rxa5 Rxa5 26. Nxa5 BA6 27. Bxd4 Rxd4 28. NC4 Rd8 29. g3 h6 30. Qa5 Bc8 31. Qxc7 BH3 32. Rg1 RD7 33. Qe5 Qxe5 34. Nxe5 Ra7 35. NC4 g5 36. RC1 BG7 37. Ne5 Ra8 38. Nf3 Bb2 39. Rb1 Bc3 40. Ng1 Bd7 41. Ne2 Bd2 42. Rd1 Be3 43. Kg2 Bg4 44. Re1 Bd2 45. Rf1 Ra2 46. h3 Bxe2 47. Rf2 Bxf4 48. Rxe2 Be5 49. RF2 KG7 50. g4 Bd4 51. Re2 Kf6 52. e5 + Bxe5 53. KF3 RA1 54. RF2 Re1 55. Kg2 + BF4 56. c3 RC1 57. d4 Rxc3 58. dxc5 Rxc5 59. b4 RC3 60. h4 Ke5 61 hxg5 hxg5 62. Re2 + Kf6 63. Kf2 Be5 64. Ra2 Rc4 65. Ra6 + Ke7 66. Ra5 Ke6 67. Ra6 + Bd6 0-1

| <Mulai << Balik Balik Berikutnya >> Akhir> |

ETD
sumber

11

Saya pikir alasan utama sulit untuk menghasilkan AI seperti itu adalah karena ruang yang dibutuhkan dalam menyimpan "pelatihan" agar efektif.

Juga (sebagai tanggapan atas komentar pelatihan-diri Anda), latihan mandiri dapat merugikan saat mencoba meningkatkan AI seperti itu - Saya telah melakukan beberapa penelitian dengan tic-tac-toe (memang jauh lebih sederhana), dan ia menemukan segala macam cara mengerikan untuk menang (dan melatih cara-cara mengerikan itu) karena kedua belah pihak bermain mengerikan. Butuh jauh lebih lama untuk mendapatkan kinerja yang masuk akal dengan pelatihan diri daripada pelatihan melawan AI yang baik di tic-tac-toe.

Namun, saya pikir akan menarik untuk melihat hibrida yang menggunakan pencarian mendalam dan "pelatihan" - semacam database yang disimpan untuk posisi midgame (bukan hanya endgame dan bukaan). Itu akan membutuhkan banyak ruang.

Mungkin Anda berpikir tentang pendekatan AI yang lebih "nyata" yang akan mempelajari konsep posisi daripada posisi win / loss / draw, tapi saya tidak berpikir itu akan sangat efektif (dibandingkan dengan mesin yang kuat).

Eve Freeman
sumber

Jawabannya dihargai. Apa yang saya yakini dalam pikiran saya adalah AI yang (a) memiliki kemampuan minimal tetapi (b) tidak memiliki fungsi evaluasi yang telah ditentukan. AI seperti itu tentu akan menyelesaikan permainan yang sangat kecil seperti tic-tac-toe dengan minimax murni. Dalam catur, permainan yang secara teori rentan terhadap minimax, AI tidak akan mengevaluasi posisi saat ini di papan tulis tetapi posisi masa depan, setelah itu minimax akan memilih langkah tersebut. Dapat dikatakan secara longgar bahwa Nimzowitsch merevolusi catur dengan menolak heuristik evaluasi yang diketahui. Jika demikian, maka bisakah mesin melakukan hal yang sama?

thb

1

Jadi Anda mengatakan akan mengembangkan fungsi evaluasinya sendiri?

Eve Freeman

2

@ THB, sebagai seorang programmer, saya pikir masalah dengan gagasan Anda adalah bahwa, sejauh yang saya bisa lihat, tidak ada catur catur yang masuk akal yang dapat dimulai dengan papan tulis yang benar-benar kosong untuk fungsi evaluasi. Seseorang dapat menulis AI yang menganalisis permainan untuk pola dan menggunakan metode statistik / probabilistik (misalnya, inferensi Bayesian) untuk menyempurnakan penilaian dan pengambilan keputusannya, tetapi programmer harus mengidentifikasi motif, faktor posisi, urutan urutan apa yang membentuk pola tersebut. dan dengan kriteria apa untuk menilai mereka. Dengan kata lain, inti dasar dari fungsi evaluasi masih perlu dirancang oleh manusia.

Greg E.

1

Mungkin menarik untuk melihat apa yang dihasilkan oleh mesin minimax genetik, misalnya, jika Anda memulai semua bagian dengan nilai material yang sama, berdasarkan win / loss / draw, dan membiarkan nilai material bermutasi. Saya yakin pencipta mesin telah mencoba mengubah ini, seperti membuat ksatria 2.9 dan uskup 3.1 pion.

Eve Freeman

1

@ THB, saya bukan ahli, tapi saya pikir itu masalahnya. Bahkan AI yang Anda tautkan dibatasi oleh bias programmer. Jika Anda membaca makalah penelitian asli, itu mencatat bahwa "vektor fitur" melatih fungsi evaluasi terdiri dari fitur papan yang "dirancang dengan hati-hati." Artinya, programmer masih harus menentukan set faktor posisi statis yang menjadi dasar pengambilan keputusan AI. Keuntungan utama dari jaringan syaraf untuk proyek khusus ini, saya pikir, adalah bahwa pelatihan dapat diparalelkan, yang memungkinkan pemrosesan asinkron dari sejumlah besar game secara efisien.

Greg E.

10

Saya hanya ingin memperluas jawaban Greg dan Wes di sini. Jenis AI yang diusulkan hanya tidak ada dengan kecanggihan yang diperlukan untuk aplikasi ini. Dan bahkan jika mereka melakukannya, saya curiga mereka akan gagal dalam hal ini. Seolah-olah thb menginginkan AI tujuan umum yang kuat yang dapat diajarkan aturan dasar permainan dan kemudian dikirim. Tetapi jika Anda melihat tujuan umum AI yang sedang dalam pengembangan mereka semua diajarkan hal-hal seperti objek dan pengenalan suara pada tingkat 1 hingga 2 tahun. Setiap tujuan umum AI pertama-tama harus memiliki kecanggihan untuk dapat memahami apa permainan bahkan sebelum itu bisa memahami cara bermain game. Anda tidak dapat merancang AI tujuan umum dan mengharapkannya berfungsi seperti AI sempit atau khusus. Tujuan umum AI perlu diajarkan catur seperti seseorang dan Anda tidak dapat berharap untuk menyatukan dua pemain pemula yang tidak memiliki pengetahuan tentang sejarah catur dan secara spontan menemukan kembali pembukaan dan tema strategis. Dibutuhkan ratusan contoh AI bermain satu sama lain, masing-masing dengan akses ke data historis semua game mereka selama ratusan ribu iterasi. Dan masing-masing AI perlu memiliki karakteristik tertentu yang berbobot pada tingkat yang berbeda.

Manusia membutuhkan hampir 500 tahun untuk mendapatkannya dari Rodrigo (Ruy) López de Segura dan Pedro Damião ke Paul Morphy dan kemudian mempertimbangkan perubahan lebih lanjut yang terjadi antara permainan Steinitz dan Alekhine. Dan semua perubahan itu terjadi melalui dinamisme ratusan ribu pemain dengan temperamen yang berbeda dan karakteristik yang memengaruhi lainnya (seperti secara acak lebih menyukai ksatria daripada uskup atau uskup daripada ksatria) belum lagi gaya bermain dan mode. Semua hal ini berkontribusi pada dinamika perubahan yang memengaruhi catur selama berabad-abad. Tidak ada AI yang lemah - bahkan AI tujuan umum yang lemah dapat menduplikasi dinamo semacam itu karena tidak memiliki keinginan. Hanya keinginan yang dapat mendorong sesuatu untuk duduk berjam-jam selama berhari-hari untuk menganalisis pembukaan dengan maksud menghancurkan atau memperbaikinya setelah saingan "merusak" itu. Sungguh ini semacam dorongan untuk analisis dan persiapan yang meningkatkan permainan selama berabad-abad - bukan permainan buta dari jutaan game antara pemain yang sama-sama lemah.

Ini seperti mengambil sekelompok orang yang tidak berbicara bahasa Inggris dan yang tidak pernah membaca master sastra asli mereka dan menempatkan mereka di sebuah ruangan dengan bahasa Inggris sebagai buku-buku Bahasa Kedua dan mengharapkan mereka untuk menghasilkan sesuatu seperti karya-karya Shakespeare. Tidak akan pernah terjadi.

EDIT : Saya seharusnya tahu lebih baik daripada membuat klaim ini karena itu telah terjadi .

"AlphaZero tidak 'mengajarkan' permainan dalam arti tradisional," jelas Chess.com. “Itu berarti tidak ada buku pembuka, tidak ada tabel endgame, dan tampaknya tidak ada algoritma rumit yang membedakan perbedaan menit antara bidak tengah dan bidak samping. Ini akan mirip dengan robot yang diberi akses ke ribuan bit dan bagian logam, tetapi tidak memiliki pengetahuan tentang mesin pembakaran, kemudian bereksperimen berkali-kali dengan setiap kombinasi yang mungkin sampai membangun Ferrari. ... Program ini memiliki empat jam untuk bermain sendiri berkali-kali, dengan demikian menjadi gurunya sendiri. ”

Kelanjutan pembicaraan saya, yang jelas tanpa dasar:

Kami menerima begitu saja semua pengetahuan implisit yang kami miliki tentang dunia. Agar dapat memahami bahwa jika saya harus memotong kayu dan paku, maka palu lebih berguna bagi saya daripada obeng, saya harus terlebih dahulu memahami bahwa kelas-kelas tertentu lebih berguna dalam situasi tertentu daripada hal-hal lain. Saya juga harus memahami bahwa segala sesuatu memiliki kegunaan yang dapat diterapkan pada suatu tujuan. Ini adalah heuristik. Jika AI tidak dapat diberitahu bahwa bagian tertentu memiliki nilai lebih dari yang lain, bagaimana ia bisa mengerti apa pasangannya? Jika tidak dapat diprogram dengan heuristik tertentu, ia harus dapat memperkirakan ide-ide ini seperti pengalaman nilai "nilai" dan "utilitas". Dan itu bukan domain AI sempit. Itu domain tujuan umum, AI kuat.

Robert Kaucher
sumber

1

Jawaban yang sangat bagus. Saya pikir paragraf pertama Anda benar-benar mengkristal ide yang saya coba sampaikan, tetapi melakukannya dengan kejernihan yang lebih besar.

Greg E.

Terima kasih, Greg. Saya hanya ingin menambahkan bahwa saya berbicara tentang AI tujuan umum yang lemah. Saya percaya bahwa AI Strong sejati dapat melakukan sesuatu seperti ini melalui banyak contoh pada banyak iterasi dalam kerangka waktu yang sangat padat. Tapi kami belum memiliki Strong AI. en.wikipedia.org/wiki/Strong_AI

Robert Kaucher

Saya setuju dengan semua yang Anda katakan kecuali bagian tentang keinginan. AI dapat duduk berjam-jam melakukan apa pun yang diinginkan oleh perancang - kekuatan komputer yang cukup dapat menyelesaikan catur, hanya saja kita belum memiliki kekuatan yang cukup.

Eve Freeman

Itu benar, Wes, tetapi kemudian kita menyuntikkan bias "programmer" atau apa pun ke dalam AI; yang merupakan salah satu hal yang tidak diinginkan oleh penulis pertanyaan.

Robert Kaucher

@EveFreeman, saya pikir Anda salah memahami apa yang saya katakan. Saya tidak mengatakan komputer tidak akan "memecahkan catur" Saya mengatakan bahwa skenario spesifik OP adalah sembelih ke titik bahwa itu tidak akan berhasil. Jika sistem tidak memiliki heuristik, bagaimana ia dapat memberi nilai pada potongan?

Robert Kaucher

9

Silakan bermeditasi tentang AI Koan berikut:

Pada hari-hari ketika Sussman adalah seorang pemula, Minsky pernah datang kepadanya ketika dia duduk meretas di PDP-6. "Apa yang kamu lakukan?", Tanya Minsky. "Saya sedang melatih jaring saraf kabel acak untuk bermain Tic-Tac-Toe," jawab Sussman. "Mengapa jaring itu diacak secara acak?", Tanya Minsky. "Saya tidak ingin itu memiliki prasangka bagaimana bermain", kata Sussman. Minsky lalu menutup matanya. "Mengapa kamu menutup mata?", Sussman bertanya pada gurunya. "Supaya ruangan itu kosong." Pada saat itu, Sussman tercerahkan.

Aplikasi kami selalu memiliki prasangka, apakah Anda menutup mata atau tidak ...

Landei
sumber

Anekdot Anda paling persuasif. Sejauh minat Anda, anekdot Anda telah mendorong saya untuk memperpanjang pertanyaan dengan pembaruan, yang dapat Anda lihat di atas ketika Anda punya waktu.

thb

8

Adakah yang pernah menulis program catur yang memiliki wawasannya sendiri? Itu mempelajari gamenya sendiri? Itu melatih dirinya sendiri?

Iya. Lihatlah mesin catur Giraffe yang ditulis oleh Matthew Lai. Dia menulis mesin catur sebagai bagian dari penelitian Kecerdasan Buatannya untuk gelar master dalam ilmu komputer.

Ada banyak diskusi tentang ini tahun lalu di forum pemrograman catur TalkChess . Saya tahu karena saya seorang penulis mesin catur yang mesinnya kira-kira sekuat Giraffe. Namun, saya menerapkan mesin saya menggunakan teknik tradisional sedangkan penulis Giraffe melatih mesinnya menggunakan "pembelajaran penguatan perbedaan temporal dengan jaringan saraf yang dalam." Matthew masih harus menerapkan pencarian alfa / beta tradisional untuk secara dinamis mengevaluasi posisi - dengan kata lain, untuk melihat ke depan banyak gerakan. Inovasinya adalah melatih mesin untuk mengevaluasi posisi statis . Sebagai perbandingan, saya menulis pengetahuan khusus ke dalam rutinitas evaluasi statis mesin saya.

Saya menulis kode untuk menyempurnakan parameter evaluasi menggunakan algoritma segerombolan partikel (lihat halaman Terima Kasih di blog saya untuk tautan ke diskusi teknis) yang menghasilkan hasil positif - mesin yang lebih kuat. Namun, ini bukan tugas membuat mesin untuk "belajar" sebanyak meminimalkan kesalahan dalam ruang parameter evaluasi yang sangat besar (urutan 10 ^ 150 kombinasi parameter diskrit).

Matthew membahas disertasinya di forum TalkChess. Dia bekerja untuk Google di DeepMind sekarang, jika saya ingat dengan benar.

Juga, periksa blog Thomas Petzke . Dia telah menulis mesin catur yang sangat kuat, iCE, dan menggunakan algoritma genetika untuk meningkatkan evaluasi statis mesin. Lihat postingnya dari 2013 dan sebelumnya, seperti Populasi Berbasis Incremental Learning .

Erik Madsen
sumber

Selamat datang di forum! Tambah satu.

SmallChess

Sepertinya diskusi ini selesai. Menguasai Catur dan Shogi dengan Bermain Sendiri dengan Algoritma Pembelajaran Penguatan Umum .

Erik Madsen

5

Pencarian Google seperti ini dapat menghasilkan hasil seperti ini .

Terutama, saya yakin Anda akan ingin melihat tulisan ini . Mereka memang memberi mesin mereka beberapa data awal seperti nilai potong, jadi bukan apa yang Anda minta, tetapi kinerjanya cukup baik.

David Spencer
sumber

+1 karena saya menghargai kutipan IEEE yang menarik. Saya sudah terbiasa dengan halaman NeuroChess. Tapi tak satu pun dari mereka yang melakukan apa yang ada dalam pikiran saya.

thb

3

Itu mungkin dengan pembelajaran mesin.

Buku pembuka mesin catur menggunakan pembelajaran mesin. Mesin menguji garis pembuka dalam buku dengan memainkannya, jika suatu garis mendapat skor yang lebih baik dibandingkan yang lain, maka garis itu dipromosikan di pohon pembukaan. Pada waktunya, mesin mempelajari garis yang lebih baik.

Setelah fase pembukaan berakhir, mesin berhenti menggunakan buku, dan mulai menggunakan fungsi evaluasi.

Bagaimana menerapkan mesin belajar mandiri menggunakan pembelajaran mesin?

Bayangkan mesin menggunakan buku tanpa fungsi evaluasi. Dan buku itu awalnya kosong. Jadi mesin tidak memiliki pengetahuan tentang catur.

Mesin mulai bermain dengan buku kosong ini, dan tidak menutup buku sampai akhir permainan. Kita bisa menganggapnya seperti mesin biasa yang menggunakan buku pembuka sampai akhir pertandingan.

Pada waktunya, mesin akan menemukan kelanjutan terbaik secara statistik, karena garis buruk akan mencetak skor lebih buruk pada waktunya. Tapi tentu saja, banyak permainan yang harus dimainkan untuk mendapatkan buku yang bagus. Saya tidak tahu berapa banyak, tetapi sebanyak yang bisa kita katakan tidak praktis.

Pembaruan Desember 2017 : Ya, saya kira Alpha Zero membuktikan saya salah dengan melatihnya sendiri cukup kuat untuk mengalahkan salah satu mesin terkuat, Stockfish, dengan jumlah permainan yang praktis .

ferit
sumber

2

Apa pun yang Anda coba di bidang ini, pastikan untuk membaca dulu kisah Turry di sini: http://waitbutwhy.com/2015/01/artificial-intelligence-revolution-2.html

TL; DR; versi spoiler per permintaan:

Dalam cerita Turry, AI yang melatih diri Turry harus menulis catatan tulisan tangan yang bagus dan akhirnya menyingkirkan manusia karena mereka tidak diperlukan untuk mencapai tujuan yang tampaknya tidak berbahaya yaitu menulis catatan tulisan tangan yang bagus. Analoginya adalah bahwa mesin catur yang terlatih sendiri dengan AI kemungkinan besar juga akan menyingkirkan manusia karena mereka tidak diperlukan untuk meningkatkan tujuan yang tampaknya tidak berbahaya untuk meningkatkan keterampilan catur.

Semangat
sumber

Jawaban Anda menarik, meskipun mungkin tidak terlalu persuasif. Saya telah membaca artikel yang ditautkan (kedua bagian) atas saran Anda. Penulis sedikit melemahkan kasusnya dengan menyerang beberapa pria jerami, tetapi ia adalah orang yang bijaksana. Saya tidak berpikir bahwa saya memiliki sesuatu yang sangat mirip dengan artikel Turry dalam pikiran. Papan catur 8-oleh-8 tempat dua pemain bergantian secara diskrit merupakan kasus yang lebih sederhana. Saya merasa luar biasa bahwa AI bahkan tidak dapat berpikir tentang catur secara umum. Untuk tampilan yang berlawanan, bacaan yang ditugaskan: Feser, Edward. Takhayul Terakhir. Namun, +1 untuk bunga.

thb

1

Dan ada AlphaZero. Rayakan generasi baru mesin catur

Prusswan
sumber

0

Penggunaan terminologi antropomorfik ketika berhadapan dengan sistem komputasi adalah gejala ketidakdewasaan profesional

Dari Bagaimana kita mengatakan kebenaran yang mungkin menyakitkan? oleh Edsger W.Dijkstra meringkaskan anggapan keliru yang mendasari pertanyaan Anda. Inteligensi buatan mungkin tiruan tetapi bukan kecerdasan dalam pengertian manusia.

Dalam 1984 Reith Lectures for BBC, filsuf Amerika John Searle menjelaskan dengan tepat apa yang salah dengan AI keras. Ringkasan "terlalu lama, tidak mendengarkan" argumennya adalah "Sintaks bukan semantik" tetapi saya akan mendorong Anda untuk setidaknya mendengarkan ceramah 2 "Mesin Kaleng Bir & Mesin Daging ".

Setelah Anda memahami apa yang dikatakan Dijkstra dan Searle lebih dari 30 tahun yang lalu, Anda akan mengenali apa yang salah dengan pertanyaan Anda:

Adakah yang pernah menulis program catur yang memiliki wawasannya sendiri? Itu mempelajari gamenya sendiri?

Manusia memiliki "wawasan" dan bisa belajar. Komputer tidak bisa. Desa manusia primitif Anda bisa selama berabad-abad mereproduksi teori pembukaan catur tetapi komputer tidak.

Menara Brian
sumber

Apakah Anda berpendapat bahwa komputer tidak akan mencapai tingkat kecerdasan manusia, atau bahkan "berpikir" dan "memahami" hanya diperuntukkan bagi manusia?

BlindKungFuMaster

@BlindKungFuMaster Jika Anda bersusah payah mendengarkan "Mesin Kaleng Bir dan Daging" di tautan di atas, akan jelas bagi Anda apa yang dipikirkan John Searle. Dia meyakinkan saya dan saya berbagi pandangannya.

Brian Towers

Pemahaman Searle yang sederhana tentang program komputer AI bisa dimaafkan, setelah itu baru 1984. Namun, arsitektur AI modern hanya meniru arsitektur pikiran manusia, jadi hanya arsitektur yang dijelaskan secara sintaksis, bukan apa yang akhirnya "dipikirkan". "Kekuatan (belum sepenuhnya) setara dengan kekuatan otak manusia" berasal dari menelan sejumlah besar data, dengan "belajar". Hanya pada langkah ini konten semantik ditangkap.

BlindKungFuMaster

Jadi argumen Chinese Room cacat dengan mengasumsikan Anda dapat mensimulasikan pemahaman dengan buku aturan besar saja, yang sebenarnya relatif tidak masuk akal, dan dengan mengabaikan kemungkinan bahwa alih-alih konten semantik dapat ditangkap oleh arsitektur yang sesuai dari sejumlah besar data. Sebenarnya, inilah yang dimaksud dengan Pemrosesan Bahasa Alami hari ini: cs224d.stanford.edu/syllabus.html

BlindKungFuMaster

@ BlindKungFuMaster Ada satu kata kunci dalam apa yang Anda katakan yang menurut saya tidak Anda mengerti. Ini adalah kata "simulasi". Saya telah 35 tahun menjadi insinyur perangkat lunak komputer dan selama waktu itu saya memiliki banyak simulator dan juga menulis beberapa simulator saya sendiri. Simulator sering merupakan komponen penting dari suatu proyek tetapi dalam proyek waktu nyata mereka tidak pernah sepenuhnya menggantikan peralatan target. Tidak diragukan lagi komputer sangat bagus dalam mensimulasikan kecerdasan dan pemahaman semantik tetapi mereka tidak pernah dapat mencapai kesadaran, kemauan, pemahaman.

Brian Towers

0

Jawaban ini diberikan oleh penanya dari pertanyaan awal, empat tahun setelah pertanyaan. Itu tidak menggantikan atau menggantikan jawaban yang diberikan sebelumnya, karena sebagian besar jawaban sebelumnya lebih menarik daripada yang ini. Namun, jawaban ini mungkin menambahkan beberapa konteks tambahan.

Sejauh yang saya tahu, sebagian besar penelitian AI tampaknya secara implisit memberikan premis bahwa pemikiran dan akal semata-mata adalah fenomena material, atau setidaknya hasil yang tidak dapat dibedakan dari pemikiran dan akal harus dapat dicapai hanya dengan proses material semata. Saya tidak membantah premis (atau mempromosikannya di sini, dalam hal ini). Saya hanya mengamati bahwa tampaknya menjadi sebuah premis.

Dan, setelah semua, dalam penelitian AI, bagaimana seharusnya ini bukan premis? Peneliti AI harus bekerja melalui proses material, apakah mereka mau atau tidak.

Para pengajar filsafat realis , kembali melalui Duns Scotus, St. Thomas, Aristoteles dan Plato, telah banyak bicara tentang teori pikiran. Perwakilan seperti Kant memiliki hal yang agak berbeda untuk dikatakan. Penelitian AI mungkin lebih dekat dengan Kant, tetapi ini tidak membuat anak sekolah salah.

Memang, ada keberatan Dewa Celah yang cenderung muncul pada saat ini dalam percakapan seperti ini, namun seorang filsuf profesional akan memberi tahu Anda bahwa keberatan Dewa Celah menyerang seorang pria jerami, bahwa keberatan ini cenderung berguna hanya terhadap orang-orang yang tidak belajar filsafat dan dengan demikian tidak tahu apa yang mereka bicarakan. Per Aristoteles, itu adalah penyebab formal dan final yang mungkin terlibat dalam pertanyaan tentang AI catur yang dilatih sendiri. Namun dalam istilah Aristoteles, peneliti AI bekerja murni dengan material dan, terutama, sebab-akibat yang efisien(Kecuali mungkin secara tidak langsung, sejauh pelatih manusia secara pribadi membawa elemen formal dan final ke dalam sistem). Jika akal formal, jika pemikiran adalah final, jika kamar Cina Searle terbukti menjadi ketidakmungkinan ontologis (seperti yang mungkin terjadi), maka mungkin saja catur AI yang terlatih sendiri tidak secara teori bahkan tidak dapat dicapai.

Saya menduga bahwa AI catur murni yang dilatih sendiri dapat benar-benar dicapai, dan akan menjadi - bahwa, dalam istilah Aristoteles, pertanyaan ini akan terbukti dapat dibingkai secara memadai mengingat hanya sebab-sebab yang efisien. Saya lebih skeptis terhadap AI yang kuat secara umum, tetapi ini harus dibuktikan dalam pengalaman, bukan? Belum ada yang tahu.

Filosofi sebab akibat dan pikiran halus, dipahami oleh sedikit (dan mungkin oleh beberapa, bahkan di antara peneliti AI, yang lebih praktis laki-laki). Jika Anda ingin belajar filosofi seperti itu, ada baiknya belajar; tetapi maklum bahwa, di internet dan bahkan sering di media cetak, sangat mudah untuk menemukan penjelasan yang menyesatkan berdasarkan kesalahpahaman yang tidak diketahui. Untuk uang saya, guru pengantar terbaik yang menulis hari ini tentang masalah ini adalah Edward Feser, yang bukunya tetap dicetak dengan harga pantas. Anda bisa belajar lebih banyak darinya.

Namun, ada yang meragukan bahwa bahkan Dr. Feser berani memberikan jawaban resmi atas pertanyaan ini! Jawabannya masih harus dibuktikan di laboratorium AI.

thb
sumber

-3

Saya ingin mereka merilis kode, lalu kita bisa bicara. Tidak mudah untuk menyelesaikan catur, Alpha tidak akan menyelesaikannya bahkan dalam setengah abad. Lucunya, ia masih memainkan 1.d4. Mengapa? Karena telah dilatih pada permainan manusia dan teori manusia memberikan tingkat kinerja tertinggi untuk 1.d4. Yang malang tidak tahu 1 ... c5 mencapai hasil imbang tepat 8 langkah. Sekarang mereka ingin saya percaya Alpha tidak menggunakan buku pembuka yang disimulasikan ... Mereka mengatakan Alpha memainkan bukaan hebat. Ya, dengan beberapa pengecualian. 1.d4 tentu saja tidak berbicara dengan baik tentang tingkat kecerdasan yang dicapai program. Untungnya, SF bahkan lebih lemah di tahap pembukaan. :)

Lyudmil Tsvetkov
sumber

3

Anda membuat klaim berani dengan mengatakan bahwa 1. ... c5 mencapai hasil imbang dalam 8 gerakan dan bahwa Stockfish lemah pada tahap pembukaan. Bisakah Anda memberikan referensi untuk klaim ini?

Pablo S. Ocal

1

1.d4 tentu saja tidak berbicara dengan baik tentang tingkat kecerdasan yang dicapai program. Sebagai pemain 1.d4, saya bertanya-tanya apakah saya harus mempertimbangkan bahwa kecerdasan saya dihina di sini.

Evargalo

Meskipun mereka belum merilis kode atau bahkan menerbitkan makalah, sebuah proyek untuk mereproduksi hasil mereka telah diluncurkan: lczero.org Anda bahkan dapat bermain dengan "AlphaZero" yang sedang berkembang di play.lczero.org

Junyan Xu

AI catur murni yang dilatih sendiri

Jawaban: