Saya ingin melatih bot yang menggunakan input teks, menghafal beberapa kategori dan menjawab pertanyaan sesuai. Selain versi 2.0, saya ingin membuat bot untuk menjawab input suara juga. Manakah algoritma pembelajaran mesin / AI terbaru yang tersedia untuk hal yang sama? Tolong beritahu saya.
machine-learning
algorithm
chat-bots
bharadwaj aldur
sumber
sumber
Jawaban:
Pertanyaan Anda sangat luas - jadi sebagai tanggapan, dua kerangka kerja luas yang saya sarankan untuk Anda lihat adalah:
sumber
Jika bot Anda "mengingat" beberapa kategori dan kemudian menjawab pertanyaan, maka itu cukup tidak berguna dalam skenario saat ini. karena dalam hal ini kinerjanya sangat buruk pada dataset yang berbeda (test-set). dalam terminologi statistik ini disebut "overfitting". dan datang untuk menjawab pertanyaan, tidak ada aturan praktis untuk mendefinisikan "state-of-art" algoritma. Meskipun Anda dapat memeriksa beberapa model yang berkinerja baik pada babi atau dataset serupa menyukai jaringan memori dinamis atau model seQ2seQ. untuk mendapatkan ide dasar dari bidang ini, saya akan menyarankan Anda untuk belajar bahasa dasar belajar mesin dan kemudian beralih ke beberapa kursus pemrosesan bahasa alami-maju (Stanford menawarkan cs224n).
sumber
Negara bagian AbuShawar & Atwell:
Makalah mereka dan makalah lainnya menyampaikan beberapa dari banyak pendekatan kontemporer untuk pelatihan chatbot pada tulisan ini.
Ekstraksi Otomatis dari Data Pelatihan Chatbot dari Natural Dialogue Corpora , Bayan AbuShawar, Eric Atwell, 2016
Konteks-Ketidakpastian-Sadar Seleksi Tindakan Chatbot melalui Pembelajaran Penguatan Bantu Parameter , Chuandong Yin, Rui Zhang, Jianzhong Qi, Yu Sun, dan Tenglun Tan, 2018
Pelatihan Sistem Pembelajaran dengan Pengawasan Menggunakan Chatbot Interaction , Publikasi Aplikasi Paten Amerika Serikat 0034828 A1, International Business Machines Corporation, Armonk, NY, US, 2019
Pelatihan Dua Langkah dan Dekode-Pengodean Campuran untuk Menerapkan Chatbot Generatif dengan Corpus Dialog Kecil , Jintae Kim, Hyeon-Gu Lee, Kim Harksoo, Kim Yeonsoo, Yeonsoo Lee, Young-Gil Kim, 2016
Seleksi Data Submodularity-Terinspirasi untuk Pelatihan Chatbot Berorientasi Tujuan Berdasarkan Embeddings Kalimat , Mladen Dimovski, Claudiu Musat, Vladimir Ilievski, Andreea Hossmann, Michael Baeriswyl, 2018
sumber
Anda dapat bekerja dengan Jaring Berulang Berulang dengan LSTM atau GRU sebagai sel memori dan embeddings kata seperti Word2vec. Model Beam search dan Attention juga dapat digunakan dengan RNNs untuk ketahanan dan bias yang lebih rendah. Tetapi output dari ini cukup besar sampai batas tertentu hanya karena penelitian di bidang ini masih panas dan banyak yang harus diurai.
sumber