Pertanyaan yang diberi tag reinforcement-learning

Seperangkat strategi dinamis dimana algoritma dapat mempelajari struktur lingkungan online dengan secara adaptif mengambil tindakan yang terkait dengan hadiah yang berbeda untuk memaksimalkan imbalan yang diperoleh.

19
Kapan memilih SARSA vs. Q Learning

SARSA dan Pembelajaran Q keduanya adalah algoritma pembelajaran penguatan yang bekerja dengan cara yang sama. Perbedaan yang paling mencolok adalah bahwa SARSA memiliki kebijakan sementara Q Learning tidak aktif. Aturan pembaruan adalah sebagai berikut: Q

14
GAM vs LOESS vs splines

Konteks : Saya ingin menggambar garis di sebar yang tidak tampak parametrik, oleh karena itu saya gunakan geom_smooth()di ggplotdalam R. Secara otomatis mengembalikan geom_smooth: method="auto" and size of largest group is >=1000, so using gam with formula: y ~ s(x, bs = "cs"). Use 'method = x'...