(Ada beberapa tantangan yang mengharuskan untuk menggunakan strategi terbaik, tetapi di sini kita tidak. Bahkan jika Anda bisa menang, Anda diperbolehkan membuat dasi)
Tantangan
Tulis program yang memainkan permainan tic-tac-toe. Itu tidak boleh kalah (karena itu, itu harus mengakhiri pertandingan baik dengan dasi atau dengan menang).
Metode I / O yang diizinkan
- Input mungkin papan saat ini. Anda dapat mengasumsikan bahwa semua gerakan sebelumnya dari pemain ke-2 dimainkan oleh mesin Anda.
- Input mungkin merupakan gerakan pemain pertama, dan fungsi Anda menyimpan gerakan yang terjadi di masa lalu. Dalam hal ini fungsinya disebut beberapa kali, satu kali untuk setiap gerakan; atau input prompt fungsi / program beberapa kali.
- Anda diizinkan untuk mengambil input tambahan dengan mengatakan jika Anda adalah pemain pertama, atau menulis dua fungsi (mungkin terkait) untuk menyelesaikan masalah pemain pertama dan pemain kedua. Jika program Anda perlu menggunakan metode input 2 (panggilan ganda), Anda dapat memutuskan apa yang diteruskan pada panggilan pertama.
- Output mungkin papan setelah giliran Anda.
- Output mungkin menjadi langkah Anda.
- Suatu gerakan dapat direpresentasikan sebagai sepasang angka (bisa 0-indeks atau 1-indeks), angka dalam rentang 0 ~ 8, atau angka dalam kisaran 1 ~ 9.
- Papan dapat direpresentasikan sebagai larik 3 × 3, atau larik panjang 9. Bahkan jika bahasa tersebut memiliki larik pengindeksan 0, Anda dapat menggunakan indeks 1.
- Sel-sel pada grid dapat menggunakan 3 nilai berbeda untuk menunjukkan
X
,O
dan mengosongkan.
Kriteria menang
Kode terpendek di setiap bahasa menang.
we can assume that all previous moves of the 2nd player were also played by our engine
Jawaban:
Befunge,
181168 bytesPosisi di papan diberi nomor 1 hingga 9. Secara default Anda mendapatkan langkah pertama, tetapi jika Anda ingin komputer untuk bergerak lebih dulu, Anda bisa memasukkan 0 untuk langkah pertama Anda. Ketika Anda sudah bergerak, komputer akan merespons dengan angka yang menunjukkan langkah mereka.
Tidak ada cek untuk memastikan Anda tidak memasukkan langkah yang valid, dan juga tidak ada cek untuk melihat apakah ada yang menang atau kalah. Setelah tidak ada lagi langkah yang harus dibuat, program hanya akan berjalan tanpa henti.
Agak sulit untuk menguji ini secara online, karena tidak ada penerjemah online dengan input interaktif. Namun, jika Anda tahu gerakan apa yang akan Anda buat di muka (yang mengasumsikan Anda tahu bagaimana komputer akan merespons), Anda dapat menguji di TIO dengan gerakan-gerakan yang diprogram sebelumnya.
Pengguna bermain lebih dulu: Cobalah secara online!
Komputer diputar terlebih dahulu: Cobalah online!
Untuk membuatnya lebih mudah untuk melihat apa yang terjadi, saya juga punya versi yang menampilkan papan antara gerakan.
Pengguna bermain lebih dulu: Cobalah secara online!
Komputer diputar terlebih dahulu: Cobalah online!
Perhatikan bahwa Anda harus menunggu hingga TIO habis sebelum Anda dapat melihat hasilnya.
Penjelasan
Papan disimpan di area memori Befunge sebagai susunan rata dari 9 nilai, diindeks dari 1 hingga 9. Ini memungkinkan kita menggunakan offset nol sebagai case khusus "no move" ketika kita ingin komputer dimainkan terlebih dahulu. Gerakan pemain disimpan sebagai 4, dan komputer bergerak sebagai 5. Untuk memulai dengan semua posisi diinisialisasi ke 32 (memori Befunge default), jadi setiap kali kita mengakses papan kita mod dengan 8, jadi kita akan kembali 0, 4 atau 5.
Mengingat pengaturan itu, jika kita menjumlahkan nilai dari tiga posisi di papan tulis, kita tahu bahwa komputer adalah satu langkah menjauh dari kemenangan jika totalnya 10, pemain satu langkah menjauh dari menang jika totalnya 8, dan posisi dibagi antara komputer dan pemain (tetapi masih satu posisi gratis) jika totalnya 9.
Seluruh strategi kami didasarkan pada konsep ini. Kami memiliki rutin yang mengambil daftar tiga kali lipat yang menunjukkan set tiga posisi di papan tulis, kami menghitung jumlah posisi-posisi itu, dan jika jumlahnya sama dengan total tertentu, komputer bergerak ke posisi mana pun dalam set yang bebas.
Daftar utama tiga kali lipat yang kami uji adalah kombinasi pemenang (1/2/3, 1/5/9, 1/4/7, dll.). Kami pertama-tama mencari total 10 (komputer akan menang), dan kemudian total 8 (pemain akan menang dan kami perlu memblokir gerakan itu). Kurang jelas, kami juga memeriksa total 9 (jika masing-masing pemain dan komputer memiliki salah satu posisi, itu strategi yang baik bagi komputer untuk mengambil yang ketiga).
Sebelum skenario terakhir itu, langkah strategis lain yang kami buat adalah memeriksa semua set sudut (1/2/4, 2/3/6, dll.) Serta dua kombinasi sudut yang berlawanan (1/8/9 dan 3 / 7/8). Jika salah satu dari kombinasi ini berjumlah 8, yaitu pemain telah mengambil dua posisi, itu adalah strategi yang baik bagi komputer untuk mengambil posisi bebas yang tersisa.
Akhirnya, ada dua gerakan kasus khusus. Pertama, kami selalu mencoba dan mengambil posisi tengah sebelum ada gerakan lain. Ini dicapai dengan rutin yang sama dengan semua gerakan kami yang lain, hanya melewati triple triple, 5/5/5, dan jumlah target 0. Selain itu, jika semua tes lain gagal menemukan langkah, kami mencoba untuk mengambil salah satu sudut atas sebagai pilihan terakhir. Sekali lagi ini hanya dicapai dengan menguji tiga kali lipat 1/1/1 dan 3/3/3, dengan jumlah target 0.
Saya tidak berpikir ini adalah strategi yang sempurna - mungkin ada game yang diundi oleh komputer yang berpotensi dimenangkan - tetapi cukup bagus untuk tidak pernah kalah dalam pertandingan. Saya telah menjalankan skrip uji yang mencoba memainkan setiap gerakan yang mungkin terhadap komputer, dan untuk setiap urutan gerakan yang valid, komputer dapat memenangkan atau menggambar permainan.
sumber
Python 2:
399401349333317370 byte2x Perbaikan Bug: kredit ke l4m2
-52 karakter: kredit ke bawah tanahmonail
-16 karakter: kredit untuk Jonathan Frech
-26 karakter: kredit ke pengguna202729
Cobalah secara Online!
Pada hari pertama kursus aljabar linear yang saya ambil semester lalu, instruktur mahasiswa pascasarjana yang cerdik mengusulkan bahwa jika Anda mewakili papan tic-tac-toe sebagai matriks:
kemudian mendapatkan tiga berturut-turut sama dengan memilih tiga angka dalam rentang [1,9] yang menambahkan hingga 15. Jawaban ini mengeksploitasi ide ini. Fungsi mengambil daftar yang berisi sembilan angka yang mewakili papan. 0 menunjukkan ruang kosong, 1 ditempati oleh lawan, dan 2 mewakili permainan sebelumnya yang dibuat oleh program. 3 baris pertama mencari tahu nomor apa yang telah diambil program (p), oposisi telah memilih (o), dan masih tersedia (a). Kemudian melihat melalui nomor yang tersedia dan melihat apakah ada dari mereka, dikombinasikan dengan dua angka yang sudah dipetiknya menambah lima belas. Jika ya, itu akan memilih kotak itu dan menang. Jika tidak ada gerakan kemenangan langsung, itu akan memeriksa untuk melihat apakah lawan dapat menang menggunakan metode yang sama. Jika mereka bisa, itu akan membawa kemenangan mereka. Jika tidak ada langkah kemenangan atau pemblokiran yang tersedia, itu akan bergerak di sudut. Ini mencegah pasangan bodoh:
Jika tidak ada satu pun dari situasi ini yang terjadi, ia akan memilih kotak secara sewenang-wenang. Fungsi ini menghasilkan angka [0,8] yang mewakili 0 diindeks kuadrat yang dipilih oleh algoritma.
Sunting: Algoritme sekarang memprioritaskan pusat di atas diagonal, yang akan mencegah kemungkinan pasangan bodoh lain yang ditunjukkan oleh l4m2 dan strategi terkait.
Sunting: Untuk memperjelas, fungsi mengambil papan dalam bentuk array dan output bergerak sebagai integer pada [0,8]. Karena strategi I / O ini begitu kikuk, inilah skrip wrapper yang membuatnya lebih interaktif. Dibutuhkan argumen baris perintah tunggal, yang harus menjadi 1 jika pemain pergi dulu, dan 0 jika program berjalan pertama.
sumber
return
baris Anda kecuali yang terakhir dapat diletakkan pada baris di depan, menghemat spasie=enumerate
, melakukanf=lambda n:[t[i]for i,j in enumerate(b)if j==n]
dan menetapkanp
,o
dana
menggunakan fungsi. Namun belum dihitung