Pertanyaan yang diberi tag dqn

Mengapa DQN memerlukan dua jaringan yang berbeda?

Aku akan melalui ini pelaksanaan DQN dan saya melihat bahwa pada baris 124 dan 125 dua jaringan yang berbeda Q telah diinisialisasi. Dari pemahaman saya, saya pikir satu jaringan memprediksi tindakan yang tepat dan jaringan kedua memprediksi nilai target Q untuk menemukan kesalahan...

reinforcement-learning q-learning dqn