Jika jaring saraf yang dalam dianggap sebagai penduga fungsi universal, apakah perluasan basis benar-benar diperlukan? Atau apakah ini spesifik kasus? Misalnya, jika seseorang memiliki tiga variabel X kuantitatif, apakah akan ada keuntungan dalam memperluas jumlah variabel dengan memperkenalkan interaksi, polinomial, dll.? Ini tampaknya memiliki utilitas yang baik dalam RF misalnya dan SVM, tapi saya tidak yakin apakah ini akan menjadi strategi yang baik untuk jaring saraf.
Jika ini mungkin terlalu luas atau tidak jelas, dapatkah seseorang mengarahkan saya ke beberapa informasi terkait tentang perluasan basis dan rekayasa fitur dalam konteks jaring yang dalam?
sumber
Banyak model pembelajaran mendalam mempelajari fitur mereka sendiri dari data input mentah selama pelatihan (misalnya, Jaringan Neural Konvolusi 2D untuk gambar). Jadi dalam banyak kasus, Anda bahkan tidak perlu khawatir untuk meneruskan variabel secara eksplisit ke model Anda. Dalam beberapa kasus lain, Anda masih memerlukan fitur, tetapi hanya fitur inti (mis., Kata-kata dalam NLP). Fitur-fitur ini direpresentasikan sebagai vektor dalam ruang embedding yang menangkap kesamaan (misalnya, bahwa 'presiden' dekat dengan 'Obama'). Ruang penyematan dapat berasal dari pra-pelatihan tanpa pengawasan (word2vec, glove) atau diinisialisasi secara acak, dan vektor disetel selama pelatihan melalui backpropagation. Arsitektur jaringan bertanggung jawab untuk mempelajari kombinasi fitur, seperti perbedaan antara 'tidak buruk, cukup baik' dan 'tidak baik,
Paragraf 'Fitur kombinasi' Bagian 3 dari Goldberg, Y. (2015). Primer pada model jaringan saraf untuk pemrosesan bahasa alami. Jurnal Penelitian Kecerdasan Buatan, 57, 345-420. menjelaskannya dengan sangat baik (saya sangat merekomendasikan membaca seluruh Bagian 3, ini sangat bagus):
sumber