Pembelajaran terawasi
- 1) Manusia membangun classifier berdasarkan input dan output data
- 2) Pengklasifikasi tersebut dilatih dengan serangkaian data pelatihan
- 3) Klasifikasi itu diuji dengan serangkaian data uji
- 4) Penempatan jika output memuaskan
Untuk digunakan ketika, "Saya tahu cara mengklasifikasikan data ini, saya hanya perlu Anda (pengklasifikasi) untuk mengurutkannya."
Titik metode: Ke label kelas atau untuk menghasilkan bilangan real
Pembelajaran tanpa pengawasan
- 1) Manusia membangun algoritma berdasarkan input data
- 2) Algoritma itu diuji dengan serangkaian uji data (di mana algoritma membuat classifier)
- 3) Penempatan jika penggolongnya memuaskan
Untuk digunakan ketika, "Saya tidak tahu cara mengklasifikasikan data ini, dapatkah Anda (algoritme) membuat classifier untuk saya?"
Poin metode: Untuk mengklasifikasikan label atau memprediksi (PDF)
Pembelajaran penguatan
- 1) Manusia membangun algoritma berdasarkan input data
- 2) Algoritme itu menyajikan keadaan yang tergantung pada input data di mana pengguna memberi hadiah atau menghukum algoritma melalui tindakan yang dilakukan algoritma, ini terus berlanjut
- 3) Algoritma itu belajar dari hadiah / hukuman dan pembaruan itu sendiri, ini berlanjut
- 4) Selalu dalam produksi, perlu belajar data nyata untuk dapat menyajikan tindakan dari negara
Untuk digunakan saat, "Saya tidak tahu cara mengklasifikasikan data ini, dapatkah Anda mengklasifikasikan data ini dan saya akan memberi Anda hadiah jika itu benar atau saya akan menghukum Anda jika tidak."
Apakah ini semacam aliran praktek-praktek ini, saya mendengar banyak tentang apa yang mereka lakukan, tetapi praktis dan teladan informasi menggemparkan kecil!
sumber
Jawaban:
Ini adalah pengantar kompak yang sangat bagus untuk ide-ide dasar!
Pembelajaran Penguatan
Saya pikir deskripsi use case Anda tentang pembelajaran penguatan tidak sepenuhnya benar. Istilah klasifikasi tidak tepat. Deskripsi yang lebih baik adalah:
Dengan kata lain, tujuannya adalah untuk mengendalikan sesuatu dengan baik, daripada mengklasifikasikan sesuatu dengan baik.
Memasukkan
Algoritma
Keluaran
sumber
Penafian: Saya bukan ahli dan saya bahkan belum pernah melakukan sesuatu dengan pembelajaran penguatan (belum), jadi umpan balik apa pun akan disambut ...
Berikut adalah jawaban yang menambahkan beberapa catatan matematika kecil ke daftar Anda dan beberapa pemikiran berbeda tentang kapan harus menggunakan apa. Saya harap pencacahannya cukup jelas:
Dibimbing
Pengaturan untuk klasifikasi dan regresi
Tidak diawasi
Pengaturan untuk pengelompokan, pengurangan dimensi, menemukan faktor tersembunyi, model generatif, dll.
Penguatan
Ini tampaknya sangat berguna untuk tugas keputusan berurutan.
Referensi:
Si, J., Barto, A., Powell, W. dan Wunsch, D. (2004) Pembelajaran Penguatan dan Hubungannya dengan Pembelajaran yang Dibimbing, dalam Buku Pegangan Pembelajaran dan Perkiraan Pemrograman Dinamis, John Wiley & Sons, Inc., Hoboken, NJ, AS. doi: 10.1002 / 9780470544785.ch2
sumber