Evaluasi Stockfish buruk

15

Ini adalah studi

NN - NN

Seperti yang Anda lihat, Stockfish memberikan kemenangan mutlak untuk hitam, meskipun itu jelas sekali imbang !!

Lihat sendiri

c4 + adalah langkah yang hilang, sedangkan Ba4 + adalah yang benar.

Apa yang sedang terjadi? Apakah Stockfish tidak mempertimbangkan posisi tertutup sama sekali ?

William Kinaan
sumber
5
Ada banyak posisi yang tidak dievaluasi oleh Stockfish dengan benar (termasuk beberapa permainan akhir umum).
Qudit
10
Terjadi sepanjang waktu! Ini adalah perangkat lunak, bukan Tuhan
David
4
Itu akan membuat saya cukup senang melihat skenario dalam nada yang sama yang dinilai sepenuhnya salah oleh AlphaZero atau Leela Zero!
leftaroundabout
1
@Qudit: Ya. Saya baru saja menunjukkan bahwa pertanyaannya harus fokus pada aspek ini, daripada mulai dari posisi yang diberikan. Maaf jika saya tidak menjelaskannya.
TonyK
3
@leftaroundabout Leela misevaluates benteng sepanjang waktu juga, lihat misalnya akhir permainan ini dari TCEC Sufi: cd.tcecbeta.club/archive.html?season=15&div=sf&game=31 . Faktanya Leela bisa membuat nilai lebih tinggi daripada Stockfish, karena cukup sering ia akan mendapatkan beberapa angka nol sementara Stockfish dengan tenang menampilkan 0,00, dan butuh waktu lama sebelum Leela menyadari bahwa lawan tidak membiarkannya menang.
Allure

Jawaban:

25

Stockfish bukanlah entitas bermain catur yang sempurna, dan Anda telah menemukan posisi di mana ia tidak dapat mengatakannya sebagai hasil imbang (setidaknya sampai 50 aturan langkah menendang dan membantunya memangkas). Posisi-posisi ini disebut " benteng ". Anda dapat mengatakan ini terjadi karena walaupun Anda memasukkan solusinya, Stockfish masih mengevaluasi posisi akhir sebagai -10 atau lebih. Posisi-posisi benteng di mana Stockfish salah, sedikit dan jarang, tetapi mereka ada, dan ini adalah salah satunya.

Sudah ada berbagai upaya untuk menulis kode deteksi benteng di Stockfish dan mesin konvensional lainnya yang dimaksudkan untuk mengenali benteng dan menghentikan Stockfish dari posisinya jika posisinya lebih unggul. Jika Anda memiliki ide yang cerdas, Anda mungkin dapat menerbitkannya di jurnal akademik (lihat publikasi di wiki pemrograman catur).

Daya tarik
sumber
11

Ini membantu untuk memahami bahwa mesin tidak benar-benar keluar dari "strategi", sebanyak mereka melihat beberapa gerakan ke masa depan, mengevaluasi skor posisi, dan menemukan set langkah optimal.

Kelemahan besar dari pendekatan itu adalah bahwa jika tidak ada yang terjadi dengan cepat, mesin akan mengalami masalah. Ini dulunya merupakan masalah besar dengan endgames. Jika Anda memiliki K + B + P vs K + P, Anda tidak menyelesaikan posisi itu hanya dalam beberapa langkah. Jadi perbaikannya adalah menambahkan Endgame Tablebases ke engine - cukup bruteforce menghitung setiap posisi endgame sebelumnya dan menambahkannya sebagai pustaka untuk digunakan engine. (Inilah sebabnya, di sebagian besar aplikasi catur murah, Anda bisa mendapatkan kemenangan hanya dengan bertahan di endgame: karena tidak memiliki tablebase endgame.)

Tapi posisi Anda (dimengerti) tidak akan berada di tablebase endgame apa pun. Jadi stockfish harus bermain jutaan posisi, merentangkan 10 atau lebih bergerak ke masa depan ... hanya untuk menemukan bahwa di semua dari mereka, hitam secara substansial naik material. Ini jelas tidak bisa dimainkan ~ 56 gerakan untuk pohon keputusan penuh - yang akan diperlukan untuk menentukan hasil imbang yang pasti.

Kevin
sumber
0

Jawaban lain mencakup pertanyaan ini dengan baik, tetapi menarik bahwa tidak semua program tidak memahami ini adalah hasil imbang. Saya menghubungkan ini ke komputer saya, dan sebagai anggota ChessBase Premium, saya juga memiliki akses ke mesin cloud.

Salah satu mesin cloud mengevaluasi ini sebagai hasil imbang hampir secara instan. Saya hanya berharap ada lebih banyak informasi daripada sekadar "Mesin Baru".

masukkan deskripsi gambar di sini

PhishMaster
sumber