Apakah GAN - jaringan permusuhan generatif - baik hanya untuk gambar, atau dapat digunakan untuk teks juga?
Seperti, latih jaringan untuk menghasilkan teks yang bermakna dari ringkasan.
UPD - kutipan dari penemu GAN Ian Goodfellow.
GAN belum diterapkan ke NLP karena GAN hanya didefinisikan untuk data bernilai riil. ( 2016 ) sumber
Ini bukan ide yang cacat secara mendasar. Itu harus mungkin untuk melakukan setidaknya salah satu berikut ... (2017) sumber
Jawaban:
Ya, GAN dapat digunakan untuk teks. Namun, ada masalah dalam kombinasi bagaimana GAN bekerja dan bagaimana teks biasanya dihasilkan oleh jaringan saraf:
2 hal ini tidak bekerja dengan baik bersama-sama sendiri, karena Anda tidak dapat menyebarkan gradien melalui unit stokastik diskrit. Ada 2 pendekatan utama untuk menangani hal ini: algoritma REINFORCE dan reparameterisasi Gumbel-Softmax (juga dikenal sebagai distribusi Beton ). Mempertimbangkan bahwa REINFORCE diketahui memiliki varian tinggi sehingga Anda membutuhkan data dalam jumlah besar untuk mendapatkan estimasi gradien yang baik.
Sebagai contoh REINFORCE untuk GAN tekstual, Anda dapat memeriksa artikel SeqGAN . Contoh Gumbel-Softmax Anda dapat memeriksa artikel ini .
Pilihan lain yang sama sekali berbeda adalah tidak memiliki unit stokastik diskrit sebagai output dari generator (misalnya menghasilkan token secara deterministik dalam ruang tertanam), sehingga menghilangkan masalah asli dari backpropagating melalui mereka.
sumber
Bahkan ada penelitian yang lebih spesifik tentang topik ini:
Xuerong Xiao, "Pembuatan Teks menggunakan Pelatihan Adversarial Generatif"
Pertanyaan ini berkaitan dengan pertanyaan ini: https://linguistics.stackexchange.com/questions/26448/how-to-translate-pelevins-creative-unit-idea-to-a-scientific-problem
sumber
Ya, GAN sekarang dapat digunakan untuk data diskrit juga. Contoh pertama dari intuisi ini muncul ketika Wasserstein GANs (WGAN) muncul. Ian Goodfellow membahas pendekatan Penguatan Pembelajaran untuk masalah ini dalam Konferensi NIPS 2016 Juga, Artikel ini membahas kemajuan dalam GAN sehubungan dengan data diskrit.
sumber