Mengapa Anda tidak melihat lapisan dropout pada contoh pembelajaran penguatan?
Saya telah melihat pembelajaran penguatan, dan secara khusus bermain-main dengan menciptakan lingkungan saya sendiri untuk digunakan dengan OpenAI Gym AI. Saya menggunakan agen dari proyek stable_baselines untuk mengujinya. Satu hal yang saya perhatikan di hampir semua contoh RL adalah bahwa...