Saya telah mencoba untuk memahami pembelajaran penguatan untuk beberapa waktu, tetapi entah bagaimana saya tidak dapat memvisualisasikan bagaimana menulis sebuah program untuk pembelajaran penguatan untuk memecahkan masalah dunia grid. Dapatkah Anda menyarankan saya beberapa buku teks yang akan membantu saya membangun konsepsi pembelajaran Reinforcement Learning yang jelas?
9
Jawaban:
Di sini Anda memiliki beberapa referensi bagus tentang Pembelajaran Penguatan:
Klasik
Sutton RS, Barto AG. Pembelajaran Penguatan: Suatu Pengantar. Cambridge, Mass: Buku Bradford; 1998. 322 hal.
Draf untuk edisi kedua tersedia gratis: http://incompleteideas.net/book/the-book-2nd.html
Russell / Norvig Bab 21:
Russell SJ, Norvig P, Davis E. Kecerdasan buatan: pendekatan modern. Upper Saddle River, NJ: Prentice Hall; 2010
Lebih teknis
Szepesvári C. Algoritma untuk pembelajaran penguatan. Kuliah Sintesis tentang Kecerdasan Buatan dan Pembelajaran Mesin. 2010; 4 (1): 1-103. http://www.ualberta.ca/~szepesva/RLBook.html
Bertsekas DP. Pemrograman Dinamis dan Kontrol Optimal. Edisi ke-4. Belmont, Mass .: Athena Scientific; 2007. 1270 p. Bab 6, vol 2 tersedia gratis: http://web.mit.edu/dimitrib/www/dpchapter.pdf
Untuk perkembangan terbaru
Wiering M, van Otterlo M, editor. Pembelajaran Penguatan. Berlin, Heidelberg: Springer Berlin Heidelberg; 2012 Tersedia dari: http://link.springer.com/10.1007/978-3-642-27645-3
Kochenderfer MJ, Amato C, Chowdhary G, Bagaimana JP, Reynolds HJD, Thornton JR, dkk. Pengambilan Keputusan Di Bawah Ketidakpastian: Teori dan Aplikasi. 1 edisi. Cambridge, Massachusetts: The MIT Press; 2015. 352 hal.
Pembelajaran penguatan multi-agen
Buşoniu L, Babuška R, Schutter BD. Pembelajaran Penguatan Multi-agen: Tinjauan. Dalam: Srinivasan D, Jain LC, editor. Inovasi dalam Sistem dan Aplikasi Multi-Agen - 1. Springer Berlin Heidelberg; 2010 hal. 183–221. Tersedia di: http://link.springer.com/chapter/10.1007/978-3-642-14435-6_7
Schwartz HM. Pembelajaran mesin multi-agen: pendekatan penguatan. Hoboken, New Jersey: Wiley; 2014
Video / Kursus
Saya juga akan menyarankan kursus David Silver di YouTube: https://www.youtube.com/playlist?list=PL5X3mDkKaJrL42i_jhE4N-p6E2Ol62Ofa
sumber
Ada kursus online gratis tentang Penguatan Pembelajaran oleh Udacity. Periksa: Pembelajaran Mesin: Pembelajaran Penguatan
sumber
Saya benar-benar menikmati Reinforcement Leraning: Pengantar oleh Richard Sutton. Ini memberikan pandangan penyatuan yang sangat bagus pada RL, meskipun tidak menyebutkan pendekatan terbaru (itu dari 1998).
sumber
Anda dapat memeriksa buku saya - Pembelajaran Praktek Dengan Python yang menjelaskan pembelajaran penguatan dari awal hingga tingkat lanjut dari algoritma pembelajaran penguatan dalam seni.
Semua kode beserta penjelasannya sudah tersedia di repo github saya. https://github.com/sudharsan13296/Hands-On-Reinforcement-Learning-With-Python
sumber