DeepMind menyatakan bahwa jaringan Q-dalam mereka (DQN) mampu untuk terus menyesuaikan perilakunya sambil belajar bermain 49 game Atari.
Setelah mempelajari semua game dengan jaringan syaraf yang sama, apakah agen dapat memainkan semuanya pada level 'manusia super' secara bersamaan (setiap kali secara acak disajikan dengan salah satu game) atau dapatkah itu hanya baik pada satu game pada satu waktu karena beralih perlu belajar kembali?
Jawaban:
Switching perlu dipelajari ulang.
Juga, perhatikan bahwa :
dan
sumber
Switching membutuhkan pembelajaran ulang, jaringan tidak memiliki satu set bobot yang memungkinkannya untuk memainkan semua game dengan baik. Ini karena masalah lupa bencana.
Namun, pekerjaan terbaru telah dilakukan untuk mengatasi masalah ini:
"Mengatasi bencana lupa dalam jaringan saraf", 2016
Kertas: https://arxiv.org/pdf/1612.00796v1.pdf
sumber