Sejauh yang saya mengerti, tampaknya, sebelum pindah, semua perangkat lunak catur kuat
- memeriksa ribuan atau jutaan kemungkinan, posisi masa depan;
- mengevaluasi setiap posisi masa depan sesuai dengan beberapa heuristik, yang disebut fungsi evaluasi;
- secara terpisah mengevaluasi setiap posisi masa depan untuk ketenangan, untuk memutuskan apakah akan mengeksplorasi kelanjutan dari posisi tersebut;
- memilih dari antara langkah-langkah yang tersedia dengan minimax; dan
- menggunakan buku pembuka.
Sejauh ini bagus. Namun, kekuatan program catur tampaknya sebagian besar bergantung pada kualitas evaluasi dan heuristik diamnya - dan juga pada buku pembuka yang, dari sudut pandang komputer, adalah satu lagi heuristik. Program catur semacam itu rupanya, hanya, yang benar-benar tahu banyak tentang permainan seperti halnya manusia yang telah membuat heuristik. Program itu tampaknya tidak memiliki wawasannya sendiri.
Adakah yang pernah menulis program catur yang memiliki wawasannya sendiri? Itu mempelajari gamenya sendiri? Itu melatih dirinya sendiri? Program seperti itu akan dilengkapi dengan aturan permainan, tentu saja, dan mungkin akan lebih jauh diberikan dengan minimax mentah dan infrastruktur diam, dan akan dapat mengenali dan menuntut pasangan yang dipaksa jika menemukan satu. Namun, itu tidak akan diberikan heuristik. Sebagai contoh, tidak akan disuruh membuka permainan menuju pusat, atau untuk lebih memilih benteng untuk ksatria, atau apa pertahanan Sisilia. Itu harus menyimpulkan prinsip-prinsip seperti itu (atau, mungkin, untuk menemukan prinsip-prinsip yang lebih baik) sendiri.
Dalam bentuknya yang murni, program semacam itu tidak akan pernah disediakan game master untuk dipelajari, tetapi hanya gamenya sendiri, yang dimainkan melawan dirinya sendiri. Hanya sekali dilatih sendiri sepenuhnya akan dilepaskan pada kompetisi manusia.
Apakah AI catur murni seperti itu ada? Pernahkah autodidak catur mekanik muncul? Memang, bisakah orang Turki tua itu belajar sendiri?
Di sini tampaknya ada pemberitahuan singkat tentang AI catur murni yang gagal.
( Pertanyaan terkait tangensial sebelumnya telah muncul di situs ini, mengenai studi komputer tentang pembukaan catur.)
MEMPERBARUI
Pertanyaan ini dianugerahi oleh tiga jawaban berbeda yang menerangi pada saat penulisan ini, oleh @WesFreeman, @GregE. dan @Landei. Ketiganya sangat direkomendasikan dan saya akan merasa bersalah ketika, menurut kebijakan situs, saya secara resmi menerima satu dengan mengesampingkan yang lain. Biarkan saya di sini mengucapkan terima kasih dan menyatakan penghargaan saya untuk ketiganya.
Pertanyaan ingin singkat. Namun respons terhadap jawaban mungkin berjalan lebih lama. Karenanya, pembaca yang tertarik dapat langsung beralih dari sini ke jawaban dan kemudian, jika masih berminat, dapat kembali membaca pembaruan yang lebih panjang yang mengikutinya.
Ketika saya mengajukan pertanyaan, saya memikirkan sesuatu seperti yang berikut.
Misalkan sebuah desa hipotetis di pinggiran Shangri-La di mana orang tidak pernah mendengar catur. Selama kunjungan singkat Anda, Anda mengajari para tetua desa aturan permainan, tetapi tidak pernah menginstruksikan mereka dalam salah satu prinsip permainan. Dua dari penatua memainkan permainan seperti yang ditonton oleh para penatua, sementara Anda (tidak ingin mengganggu permainan dengan kibitzing) membatasi komentar Anda pada pertanyaan aturan. Tidak ada postmortem yang mengikuti permainan, catur juga tidak dimainkan atau dibahas lagi saat Anda tetap di Shangri-La. Namun, ketika Anda pergi, tidak pernah kembali, Anda meninggalkan catur Anda.
Dalam ketidakhadiran Anda, para penatua mengajarkan permainan kepada orang-orang. Beberapa orang kemudian bermain sedikit selama waktu senggang, beberapa dengan antusiasme yang tumbuh, yang membuat set catur mereka sendiri.
Mungkin tidak segera jelas bagi penduduk desa bahwa benteng lebih baik daripada ksatria, tetapi orang-orang mungkin secara bertahap masih mengusahakan kekuatan relatif dari bidak catur atas permainan banyak permainan. Demikian juga, mungkin tidak segera jelas bagi mereka bahwa 1. a4 adalah pembukaan yang buruk: mereka bisa tetapi mencobanya dan mempertimbangkan hasilnya.
Sampai sejauh mana pemahaman penduduk desa tentang permainan pada akhirnya akan menyatu dengan dunia luar? Karena tidak memiliki buku pembuka, dapatkah mereka mengembangkan bukaan novel sendiri? Tentu saja, orang tidak akan berharap pembukaan desa menjadi sangat baik pada awalnya, tetapi, setelah beberapa abad terisolasi, penduduk desa mungkin mengembangkan repertoar pembukaan yang terhormat, untuk yang saya tahu.
Akankah salah satu dari bukaan mereka, dikembangkan secara independen, terbukti menarik bagi dunia luar, ketika pelancong berikutnya melintas untuk mencatatnya, 200 tahun kemudian? Mungkinkah Shangri-La memberi dunia baru, novel, Shangri-La Defense?
Jika demikian, maka, sehubungan dengan pertanyaan awal saya tentang catur AI, apa yang ada dalam pikiran saya kurang lebih ini: bisakah seorang catur catur lebih atau kurang meniru kemajuan catur penduduk desa di pinggiran Shanrgi-La?
Mengingat kisah Sussman dalam jawaban @ Landei di bawah ini, tidak diragukan lagi benar bahwa penduduk desa saya akan membawa prasangka tertentu ke permainan. Sebagai contoh, mereka akan membawa pemahaman bahwa memiliki lebih banyak hal yang bermanfaat pada umumnya lebih baik daripada memiliki lebih sedikit dari itu, dan karena itu untuk menangkap bidak catur lawan mungkin, biasanya lebih baik daripada menderita penangkapan sendiri. Seberapa teritorial orang-orang fiksi Shangri-La pada dasarnya adalah pertanyaan untuk sastra, tetapi orang dapat berasumsi bahwa mereka akan mengenali posisi yang memerintahkan lebih banyak ruang sebagai lebih unggul daripada posisi yang kurang diperintahkan. Dan setiap pemula yang cerdas, sekali ditunjukkan set catur dan diinstruksikan dalam aturan permainan, dapat menyimpulkan bahwa seorang ratu mungkin lebih baik daripada pion, hanya dengan itu ratu memiliki hingga 27 langkah yang tersedia,
Pertanyaan saya karena itu tidak perlu ditafsirkan untuk menyiratkan perintah mutlak, gaya Sussman terhadap membawa segala jenis pengetahuan apa pun ke papan catur; melainkan untuk menyiratkan perintah umum terhadap pengetahuan khusus catur yang sudah terbentuk sebelumnya. Setelah semua (mengabaikan masalah evolusi aturan permainan lama), pada suatu waktu di masa lalu, permainan catur pertama kali dimainkan. Mungkin pemain pertama membuka 1. a4; tetapi akhirnya dia belajar lebih baik, dan mengajarkan apa yang telah dia pelajari kepada murid-muridnya; yang pada gilirannya belajar lebih banyak dan mengajar lebih banyak, dari generasi ke generasi, untuk memberi kita Kasparov.
Mungkinkah AI tidak melakukan hal seperti itu, hanya dalam beberapa minggu dan bukan abad?
Plato akan skeptis, saya kira. Hume akan lebih optimis, tetapi pertanyaannya tidak lagi diselesaikan oleh filsafat saja. Kami memiliki komputer elektronik sekarang untuk menguji proposisi, dan saya bertanya-tanya apa keadaan seni AI itu. AI catur terbaik saat ini tampaknya benar-benar sistem pakar yang tidak cerdas yang mengalahkan semua orang sambil tidak menghasilkan apa-apa. Saya bertanya-tanya apakah AI yang sedikit lebih luas yang, dalam beberapa hal, benar-benar berpikir tentang catur, telah cukup berhasil dalam mengajar diri mereka sendiri permainan.
Saya berpendapat bahwa jawabannya adalah tidak, mungkin tidak.
Jawaban:
Anda memiliki beberapa poin yang sangat menarik. Saya memiliki sedikit pengalaman dalam penelitian AI (M.Sc. saya berada di bidang ini), jadi saya pikir saya dapat memberikan beberapa wawasan.
Telusuri kembali di area tersebut
Pertama, penelitian dalam bidang ini benar-benar terjadi - mencari "catur pendekatan evolusi" muncul dengan makalah ini dari tahun 2001, melakukan hampir semua yang Anda sarankan, meninggalkan pendekatan min / max dan hanya memodifikasi fungsi evaluasi. Mungkin untuk menggali lebih banyak lagi, dan saya mengetahui beberapa orang yang bekerja di bidang ini secara umum.
Kemungkinan teoretis
Menurut pendapat saya, satu-satunya faktor pembatas nyata untuk penciptaan "murni" catur yang bermain AI adalah waktu komputasi. Sama sekali tidak ada alasan mengapa AI seperti itu tidak dapat dibuat secara teoritis menggunakan pendekatan saat ini.
Kepraktisan
Ada dua masalah utama dengan menggunakan pendekatan evolusi atau genetik dalam mengembangkan fungsi heuristik catur, yang pertama adalah bahwa bahkan pada dasarnya, fungsi heuristik untuk catur sangat kompleks. Kita berbicara ratusan aturan, penilaian sepotong (yang mungkin berbeda berdasarkan posisi, dll), analisis posisi, dll. Anda akan memerlukan bahasa komputer yang fleksibel untuk menjelaskan aturan ini, dan kemudian aturan ini dapat dibuat secara acak, bermutasi, berkembang biak satu sama lain, dll. Ini tentu saja mungkin, tetapi saya kira Anda akan berakhir dengan seperangkat aturan yang terdiri dari beberapa ribu entitas. Itu aturan yang sangat besar yang diatur untuk berkembang secara dinamis.
Masalah kedua adalah bahwa untuk benar-benar mengevaluasi aturan yang baru Anda modifikasi, Anda harus memainkan permainan catur, dan melihat siapa yang akhirnya menang. Jika Anda ingin melakukan ini dengan "benar", Anda harus memberi kedua pemain banyak waktu untuk berpikir, sesuatu yang mirip dengan panjang permainan yang umum. Namun, bermain hanya dengan satu lawan saja tidak cukup, Anda ingin memainkan banyak lawan yang berbeda, dan mungkin bahkan lawan yang sama, berkali-kali, sebelum Anda benar-benar yakin bahwa Anda telah menemukan peningkatan dalam kekuatan permainan. Ini mungkin berarti bermain beberapa ratus game per individu dalam populasi Anda, dan itu memberi Anda satu generasi algoritma Anda.
Biasanya dengan jenis pendekatan ini, Anda akan melihat setidaknya beberapa ratus generasi, atau dengan fungsi rumit seperti heuristik catur, beberapa ratus ribu (atau bahkan jutaan) generasi. Beberapa matematika cepat harus meyakinkan Anda bahwa Anda akan memerlukan beberapa ribu jam waktu CPU untuk satu generasi, bahkan untuk mengecilkan server pertanian berukuran besar, Anda mungkin perlu beberapa (mungkin ratusan) tahun untuk benar-benar berkembang, persis seperti Anda sebutkan di pembaruan Anda.
Pada akhir waktu itu, Anda akan memiliki algoritma yang menarik yang mungkin akan memiliki banyak wawasan tentang permainan yang belum pernah benar-benar ditemukan. Sulit untuk mengatakan apakah itu berguna atau bahkan dapat dimengerti oleh manusia. Mengapa aturan ini ada? Karena lebih dari beberapa ribu permainan, sepertinya berhasil.
Masa depan
Saya tidak ragu bahwa pendekatan ini akan mendapatkan lebih banyak popularitas, karena daya komputasi meningkat. Saat ini, kami berada pada titik di mana mesin memiliki waktu komputasi yang cukup untuk mengalahkan (hampir semua) manusia, jika kecerdasannya dibuat dengan cermat. Dalam waktu 20 tahun, sangat mungkin bahwa prosesor akan bergerak sangat jauh sehingga satu atau dua gerakan ekstra tidak lagi memberikan manfaat yang cukup bagi mesin "hard-coded", tetapi secara rutin dikalahkan oleh mesin yang berevolusi, anehnya intuitif yang memiliki jutaan jam evolusi di belakang mereka.
Pembaruan 2018 Mei
Seperti yang dikatakan Robert Kaucher dalam komentar di bawah, berita terbaru layak disebutkan di sini. Secara khusus, proyek Google AlphaGo tampaknya menjadi pendekatan berbasis AI pertama yang benar-benar layak untuk jenis-jenis permainan ini, dan pada akhir 2017, mengklaim telah menang melawan StockFish 2 , setelah dirancang ulang untuk tugas tersebut.
sumber
Saya menduga bahwa apa yang Anda tanyakan akan diklasifikasikan sebagai semacam algoritma genetika atau pendekatan algoritma evolusi . Saya menduga tidak ada cara realistis untuk merancang algoritma seperti itu tanpa secara intrinsik menanamkan beberapa derajat bias manusia pada tingkat fundamental, karena programmer masih harus mendefinisikan fitur statis dari suatu posisi (hitungan material, struktur gadai, kompleks warna, dll.) dimana AI akan mengklasifikasikan dan membandingkan posisi dari game yang berbeda. Jika Anda melakukan pencarian Google pada terminologi algoritmik di atas dalam konteks catur, Anda akan menemukan banyak hasil, tetapi mungkin sedikit dalam penelitian serius yang sebenarnya telah digunakan untuk membangun AI yang kompetitif dan kompetitif.
Faktanya adalah, sebagai konsekuensi dari hukum Moore, komputer sekarang adalah mesin penghitung yang sangat kuat sehingga metode AI yang sangat canggih tidak hanya tidak perlu (dalam hal bermain pada tingkat yang lebih tinggi dari lawan manusia terbaik), tetapi bahkan dapat dibayangkan menjadi kontra-produktif. Catur adalah jenis permainan di mana - terutama karena ruang pencariannya yang relatif kecil dari gerakan yang wajar dalam posisi apa pun dan adanya pemaksaan kombinasi taktis (terdiri dari urutan pemeriksaan, tangkapan sepotong, ancaman pasangan atau kehilangan materi yang sangat besar, dll.) - pendekatan brute-force dengan beberapa pemangkasan pohon pencarian konservatif secara simultan merupakan pendekatan yang paling sederhana secara algoritmik dan paling efektif. Jika Anda memperhitungkan ketersediaan tabel endgame dan buku pembuka, logika pendekatan itu hanya tumbuh. Saya mengerti bahwa ada sa masih banyak minat teoretis dan nilai potensial dalam jenis novel AI yang sedang Anda bicarakan, tetapi saya menduga catur adalah arena yang salah untuk mengembangkannya. Di sisi lain, permainan seperti Go, yang pada dasarnya kurang taktis dan mencakup ruang pencarian yang jauh lebih besar yang menjadikan pendekatan brute-force tidak praktis, mungkin menjadi kandidat yang lebih baik untuk penelitian mutakhir AI.
sumber
Lihat halaman Wikipedia tentang Bermain Game Umum . Ini adalah area penelitian aktif. Ada turnamen GGP tahunan di mana program diberi aturan permainan baru, bisa memikirkannya sebentar, dan kemudian mainkan permainan itu satu sama lain.
Jika Anda memberikan aturan catur ke program GGP, saya pikir Anda akan mendapati bahwa permainan catur lebih kuat daripada pemula manusia dan jauh lebih lemah daripada program catur yang ditulis khusus.
sumber
Layak meninjau kembali pertanyaan ini mengingat keberhasilan AlphaZero baru-baru ini melawan Stockfish 8 . Evolusi lebih lanjut dari program DeepGoGo AlphaGo dan AlphaGo Zero, AlphaZero selesai dengan skor mengejutkan +28 = 72 -0 melawan salah satu mesin catur "tradisional" terkuat di planet ini.
AlphaZero belajar sendiri untuk bermain melalui pembelajaran penguatan, melatih arsitektur jaringan saraf melalui serangkaian game melawan dirinya sendiri. Menurut kertas terlampir :
Saya yakin orang dapat mengajukan pertanyaan tentang hal-hal seperti perangkat keras yang berbeda yang digunakan - " AlphaZero ... menggunakan mesin tunggal dengan 4 TPU . Stockfish ... dimainkan pada tingkat keterampilan terkuatnya menggunakan 64 benang dan ukuran hash 1GB. " - tetapi bagaimanapun juga hasil AlphaZero adalah yang luar biasa, dan sangat tergantung pada OP.
Mengungkap bahkan mungkin lebih banyak dukungan untuk seberapa sedikit pengetahuan khusus domain yang dimainkan, selain mengalahkan Stockfish dalam catur, AlphaZero juga dilatih di shogi hingga menjadi yang terbaik dalam program juara Elmo, dan tentu saja juga melampaui pendahulunya AlphaGo Zero in Go .
Berikut adalah salah satu pertandingan melawan Stockfish, Berlin di mana ketidakseimbangan materi akhirnya AlphaZero dengan pasangan uskup melawan ksatria dan 4 pion untuk Stockfish setelah
31.Qxc7
. Dalam posisi itu, semua karya AlphaZero ada di peringkat belakang, dengan para uskup kembali di kotak aslinya. Pada akhirnya, setelah ratu keluar potongan hitam bermanuver perlahan untuk mengambil pion putih, dan itu tirai.sumber
Saya pikir alasan utama sulit untuk menghasilkan AI seperti itu adalah karena ruang yang dibutuhkan dalam menyimpan "pelatihan" agar efektif.
Juga (sebagai tanggapan atas komentar pelatihan-diri Anda), latihan mandiri dapat merugikan saat mencoba meningkatkan AI seperti itu - Saya telah melakukan beberapa penelitian dengan tic-tac-toe (memang jauh lebih sederhana), dan ia menemukan segala macam cara mengerikan untuk menang (dan melatih cara-cara mengerikan itu) karena kedua belah pihak bermain mengerikan. Butuh jauh lebih lama untuk mendapatkan kinerja yang masuk akal dengan pelatihan diri daripada pelatihan melawan AI yang baik di tic-tac-toe.
Namun, saya pikir akan menarik untuk melihat hibrida yang menggunakan pencarian mendalam dan "pelatihan" - semacam database yang disimpan untuk posisi midgame (bukan hanya endgame dan bukaan). Itu akan membutuhkan banyak ruang.
Mungkin Anda berpikir tentang pendekatan AI yang lebih "nyata" yang akan mempelajari konsep posisi daripada posisi win / loss / draw, tapi saya tidak berpikir itu akan sangat efektif (dibandingkan dengan mesin yang kuat).
sumber
Saya hanya ingin memperluas jawaban Greg dan Wes di sini. Jenis AI yang diusulkan hanya tidak ada dengan kecanggihan yang diperlukan untuk aplikasi ini. Dan bahkan jika mereka melakukannya, saya curiga mereka akan gagal dalam hal ini. Seolah-olah thb menginginkan AI tujuan umum yang kuat yang dapat diajarkan aturan dasar permainan dan kemudian dikirim. Tetapi jika Anda melihat tujuan umum AI yang sedang dalam pengembangan mereka semua diajarkan hal-hal seperti objek dan pengenalan suara pada tingkat 1 hingga 2 tahun. Setiap tujuan umum AI pertama-tama harus memiliki kecanggihan untuk dapat memahami apa permainan bahkan sebelum itu bisa memahami cara bermain game. Anda tidak dapat merancang AI tujuan umum dan mengharapkannya berfungsi seperti AI sempit atau khusus. Tujuan umum AI perlu diajarkan catur seperti seseorang dan Anda tidak dapat berharap untuk menyatukan dua pemain pemula yang tidak memiliki pengetahuan tentang sejarah catur dan secara spontan menemukan kembali pembukaan dan tema strategis. Dibutuhkan ratusan contoh AI bermain satu sama lain, masing-masing dengan akses ke data historis semua game mereka selama ratusan ribu iterasi. Dan masing-masing AI perlu memiliki karakteristik tertentu yang berbobot pada tingkat yang berbeda.
Manusia membutuhkan hampir 500 tahun untuk mendapatkannya dari Rodrigo (Ruy) López de Segura dan Pedro Damião ke Paul Morphy dan kemudian mempertimbangkan perubahan lebih lanjut yang terjadi antara permainan Steinitz dan Alekhine. Dan semua perubahan itu terjadi melalui dinamisme ratusan ribu pemain dengan temperamen yang berbeda dan karakteristik yang memengaruhi lainnya (seperti secara acak lebih menyukai ksatria daripada uskup atau uskup daripada ksatria) belum lagi gaya bermain dan mode. Semua hal ini berkontribusi pada dinamika perubahan yang memengaruhi catur selama berabad-abad. Tidak ada AI yang lemah - bahkan AI tujuan umum yang lemah dapat menduplikasi dinamo semacam itu karena tidak memiliki keinginan. Hanya keinginan yang dapat mendorong sesuatu untuk duduk berjam-jam selama berhari-hari untuk menganalisis pembukaan dengan maksud menghancurkan atau memperbaikinya setelah saingan "merusak" itu. Sungguh ini semacam dorongan untuk analisis dan persiapan yang meningkatkan permainan selama berabad-abad - bukan permainan buta dari jutaan game antara pemain yang sama-sama lemah.
Ini seperti mengambil sekelompok orang yang tidak berbicara bahasa Inggris dan yang tidak pernah membaca master sastra asli mereka dan menempatkan mereka di sebuah ruangan dengan bahasa Inggris sebagai buku-buku Bahasa Kedua dan mengharapkan mereka untuk menghasilkan sesuatu seperti karya-karya Shakespeare. Tidak akan pernah terjadi.
EDIT : Saya seharusnya tahu lebih baik daripada membuat klaim ini karena itu telah terjadi .
Kelanjutan pembicaraan saya, yang jelas tanpa dasar:
Kami menerima begitu saja semua pengetahuan implisit yang kami miliki tentang dunia. Agar dapat memahami bahwa jika saya harus memotong kayu dan paku, maka palu lebih berguna bagi saya daripada obeng, saya harus terlebih dahulu memahami bahwa kelas-kelas tertentu lebih berguna dalam situasi tertentu daripada hal-hal lain. Saya juga harus memahami bahwa segala sesuatu memiliki kegunaan yang dapat diterapkan pada suatu tujuan. Ini adalah heuristik. Jika AI tidak dapat diberitahu bahwa bagian tertentu memiliki nilai lebih dari yang lain, bagaimana ia bisa mengerti apa pasangannya? Jika tidak dapat diprogram dengan heuristik tertentu, ia harus dapat memperkirakan ide-ide ini seperti pengalaman nilai "nilai" dan "utilitas". Dan itu bukan domain AI sempit. Itu domain tujuan umum, AI kuat.
sumber
Silakan bermeditasi tentang AI Koan berikut:
Aplikasi kami selalu memiliki prasangka, apakah Anda menutup mata atau tidak ...
sumber
Iya. Lihatlah mesin catur Giraffe yang ditulis oleh Matthew Lai. Dia menulis mesin catur sebagai bagian dari penelitian Kecerdasan Buatannya untuk gelar master dalam ilmu komputer.
Ada banyak diskusi tentang ini tahun lalu di forum pemrograman catur TalkChess . Saya tahu karena saya seorang penulis mesin catur yang mesinnya kira-kira sekuat Giraffe. Namun, saya menerapkan mesin saya menggunakan teknik tradisional sedangkan penulis Giraffe melatih mesinnya menggunakan "pembelajaran penguatan perbedaan temporal dengan jaringan saraf yang dalam." Matthew masih harus menerapkan pencarian alfa / beta tradisional untuk secara dinamis mengevaluasi posisi - dengan kata lain, untuk melihat ke depan banyak gerakan. Inovasinya adalah melatih mesin untuk mengevaluasi posisi statis . Sebagai perbandingan, saya menulis pengetahuan khusus ke dalam rutinitas evaluasi statis mesin saya.
Saya menulis kode untuk menyempurnakan parameter evaluasi menggunakan algoritma segerombolan partikel (lihat halaman Terima Kasih di blog saya untuk tautan ke diskusi teknis) yang menghasilkan hasil positif - mesin yang lebih kuat. Namun, ini bukan tugas membuat mesin untuk "belajar" sebanyak meminimalkan kesalahan dalam ruang parameter evaluasi yang sangat besar (urutan 10 ^ 150 kombinasi parameter diskrit).
Matthew membahas disertasinya di forum TalkChess. Dia bekerja untuk Google di DeepMind sekarang, jika saya ingat dengan benar.
Juga, periksa blog Thomas Petzke . Dia telah menulis mesin catur yang sangat kuat, iCE, dan menggunakan algoritma genetika untuk meningkatkan evaluasi statis mesin. Lihat postingnya dari 2013 dan sebelumnya, seperti Populasi Berbasis Incremental Learning .
sumber
Pencarian Google seperti ini dapat menghasilkan hasil seperti ini .
Terutama, saya yakin Anda akan ingin melihat tulisan ini . Mereka memang memberi mesin mereka beberapa data awal seperti nilai potong, jadi bukan apa yang Anda minta, tetapi kinerjanya cukup baik.
sumber
Itu mungkin dengan pembelajaran mesin.
Buku pembuka mesin catur menggunakan pembelajaran mesin. Mesin menguji garis pembuka dalam buku dengan memainkannya, jika suatu garis mendapat skor yang lebih baik dibandingkan yang lain, maka garis itu dipromosikan di pohon pembukaan. Pada waktunya, mesin mempelajari garis yang lebih baik.
Setelah fase pembukaan berakhir, mesin berhenti menggunakan buku, dan mulai menggunakan fungsi evaluasi.
Bagaimana menerapkan mesin belajar mandiri menggunakan pembelajaran mesin?
Bayangkan mesin menggunakan buku tanpa fungsi evaluasi. Dan buku itu awalnya kosong. Jadi mesin tidak memiliki pengetahuan tentang catur.
Mesin mulai bermain dengan buku kosong ini, dan tidak menutup buku sampai akhir permainan. Kita bisa menganggapnya seperti mesin biasa yang menggunakan buku pembuka sampai akhir pertandingan.
Pada waktunya, mesin akan menemukan kelanjutan terbaik secara statistik, karena garis buruk akan mencetak skor lebih buruk pada waktunya. Tapi tentu saja, banyak permainan yang harus dimainkan untuk mendapatkan buku yang bagus. Saya tidak tahu berapa banyak, tetapi sebanyak yang bisa kita katakan tidak praktis.
Pembaruan Desember 2017 : Ya, saya kira Alpha Zero membuktikan saya salah dengan melatihnya sendiri cukup kuat untuk mengalahkan salah satu mesin terkuat, Stockfish, dengan jumlah permainan yang praktis .
sumber
Apa pun yang Anda coba di bidang ini, pastikan untuk membaca dulu kisah Turry di sini: http://waitbutwhy.com/2015/01/artificial-intelligence-revolution-2.html
TL; DR; versi spoiler per permintaan:
sumber
Dan ada AlphaZero. Rayakan generasi baru mesin catur
sumber
Dari Bagaimana kita mengatakan kebenaran yang mungkin menyakitkan? oleh Edsger W.Dijkstra meringkaskan anggapan keliru yang mendasari pertanyaan Anda. Inteligensi buatan mungkin tiruan tetapi bukan kecerdasan dalam pengertian manusia.
Dalam 1984 Reith Lectures for BBC, filsuf Amerika John Searle menjelaskan dengan tepat apa yang salah dengan AI keras. Ringkasan "terlalu lama, tidak mendengarkan" argumennya adalah "Sintaks bukan semantik" tetapi saya akan mendorong Anda untuk setidaknya mendengarkan ceramah 2 "Mesin Kaleng Bir & Mesin Daging ".
Setelah Anda memahami apa yang dikatakan Dijkstra dan Searle lebih dari 30 tahun yang lalu, Anda akan mengenali apa yang salah dengan pertanyaan Anda:
Manusia memiliki "wawasan" dan bisa belajar. Komputer tidak bisa. Desa manusia primitif Anda bisa selama berabad-abad mereproduksi teori pembukaan catur tetapi komputer tidak.
sumber
Jawaban ini diberikan oleh penanya dari pertanyaan awal, empat tahun setelah pertanyaan. Itu tidak menggantikan atau menggantikan jawaban yang diberikan sebelumnya, karena sebagian besar jawaban sebelumnya lebih menarik daripada yang ini. Namun, jawaban ini mungkin menambahkan beberapa konteks tambahan.
Sejauh yang saya tahu, sebagian besar penelitian AI tampaknya secara implisit memberikan premis bahwa pemikiran dan akal semata-mata adalah fenomena material, atau setidaknya hasil yang tidak dapat dibedakan dari pemikiran dan akal harus dapat dicapai hanya dengan proses material semata. Saya tidak membantah premis (atau mempromosikannya di sini, dalam hal ini). Saya hanya mengamati bahwa tampaknya menjadi sebuah premis.
Dan, setelah semua, dalam penelitian AI, bagaimana seharusnya ini bukan premis? Peneliti AI harus bekerja melalui proses material, apakah mereka mau atau tidak.
Para pengajar filsafat realis , kembali melalui Duns Scotus, St. Thomas, Aristoteles dan Plato, telah banyak bicara tentang teori pikiran. Perwakilan seperti Kant memiliki hal yang agak berbeda untuk dikatakan. Penelitian AI mungkin lebih dekat dengan Kant, tetapi ini tidak membuat anak sekolah salah.
Memang, ada keberatan Dewa Celah yang cenderung muncul pada saat ini dalam percakapan seperti ini, namun seorang filsuf profesional akan memberi tahu Anda bahwa keberatan Dewa Celah menyerang seorang pria jerami, bahwa keberatan ini cenderung berguna hanya terhadap orang-orang yang tidak belajar filsafat dan dengan demikian tidak tahu apa yang mereka bicarakan. Per Aristoteles, itu adalah penyebab formal dan final yang mungkin terlibat dalam pertanyaan tentang AI catur yang dilatih sendiri. Namun dalam istilah Aristoteles, peneliti AI bekerja murni dengan material dan, terutama, sebab-akibat yang efisien(Kecuali mungkin secara tidak langsung, sejauh pelatih manusia secara pribadi membawa elemen formal dan final ke dalam sistem). Jika akal formal, jika pemikiran adalah final, jika kamar Cina Searle terbukti menjadi ketidakmungkinan ontologis (seperti yang mungkin terjadi), maka mungkin saja catur AI yang terlatih sendiri tidak secara teori bahkan tidak dapat dicapai.
Saya menduga bahwa AI catur murni yang dilatih sendiri dapat benar-benar dicapai, dan akan menjadi - bahwa, dalam istilah Aristoteles, pertanyaan ini akan terbukti dapat dibingkai secara memadai mengingat hanya sebab-sebab yang efisien. Saya lebih skeptis terhadap AI yang kuat secara umum, tetapi ini harus dibuktikan dalam pengalaman, bukan? Belum ada yang tahu.
Filosofi sebab akibat dan pikiran halus, dipahami oleh sedikit (dan mungkin oleh beberapa, bahkan di antara peneliti AI, yang lebih praktis laki-laki). Jika Anda ingin belajar filosofi seperti itu, ada baiknya belajar; tetapi maklum bahwa, di internet dan bahkan sering di media cetak, sangat mudah untuk menemukan penjelasan yang menyesatkan berdasarkan kesalahpahaman yang tidak diketahui. Untuk uang saya, guru pengantar terbaik yang menulis hari ini tentang masalah ini adalah Edward Feser, yang bukunya tetap dicetak dengan harga pantas. Anda bisa belajar lebih banyak darinya.
Namun, ada yang meragukan bahwa bahkan Dr. Feser berani memberikan jawaban resmi atas pertanyaan ini! Jawabannya masih harus dibuktikan di laboratorium AI.
sumber
Saya ingin mereka merilis kode, lalu kita bisa bicara. Tidak mudah untuk menyelesaikan catur, Alpha tidak akan menyelesaikannya bahkan dalam setengah abad. Lucunya, ia masih memainkan 1.d4. Mengapa? Karena telah dilatih pada permainan manusia dan teori manusia memberikan tingkat kinerja tertinggi untuk 1.d4. Yang malang tidak tahu 1 ... c5 mencapai hasil imbang tepat 8 langkah. Sekarang mereka ingin saya percaya Alpha tidak menggunakan buku pembuka yang disimulasikan ... Mereka mengatakan Alpha memainkan bukaan hebat. Ya, dengan beberapa pengecualian. 1.d4 tentu saja tidak berbicara dengan baik tentang tingkat kecerdasan yang dicapai program. Untungnya, SF bahkan lebih lemah di tahap pembukaan. :)
sumber