Dalam pembelajaran penguatan, pendekatan fungsi linear sering digunakan ketika ruang keadaan besar hadir. (Ketika mencari tabel menjadi tidak layak.)
Bentuk nilai dengan pendekatan fungsi linear diberikan oleh
di mana adalah bobot, dan adalah fitur.
Fitur-fiturnya sudah ditentukan oleh pengguna. Pertanyaan saya adalah, bagaimana bobot diberikan?
Saya telah membaca / mengunduh beberapa slide kuliah tentang learning dengan perkiraan fungsi. Sebagian besar dari mereka memiliki slide tentang regresi linier yang mengikutinya. Karena mereka hanya slide, mereka cenderung tidak lengkap. Saya bertanya-tanya apa hubungan / hubungan antara kedua topik tersebut.