1) Sebagian besar jaringan saraf tidak dapat melakukan perkalian; mereka hanya dapat menghitung jumlah (yang kemudian secara individual diumpankan melalui fungsi aktivasi ). Mereka harus memperkirakan perkalian tersebut jika itu penting, yang membutuhkan banyak neuron, terutama jika faktor-faktor dapat menjangkau rentang yang besar.
Jika ternyata area rumah sebenarnya merupakan fitur penting, Anda akan membantu jaringan jika Anda menyediakannya, karena kemudian dapat menggunakan neuron yang diperlukan untuk memperkirakan perkalian lebar dan panjang. untuk melakukan hal-hal lain.
Oleh karena itu, termasuk fitur polinomial dalam beberapa kasus mungkin bermanfaat bagi jaringan, tetapi dalam kasus lain tidak memiliki efek signifikan. Lebih jauh, fitur polinomial hanya satu jenis fitur turunan yang mungkin bermanfaat bagi jaringan. Tipe lain dari fitur turunan yang mungkin ternyata bermanfaat adalah sebagai contoh logaritma dari variabel input (dianggap positif) yang juga harus diperkirakan oleh jaringan.
Gagasannya adalah untuk memungkinkan jaringan melakukan lebih banyak operasi antar angka daripada hanya penambahan, untuk memungkinkannya menghitung hal-hal seperti fitur polinomial itu sendiri secara efisien, tetapi tidak jelas bagaimana cara kerjanya. Salah satu arsitektur yang kelihatannya melakukan sesuatu yang serupa adalah jaringan penjumlahan produk .
2) Kecuali dari biaya komputasi yang disebutkan John, meningkatkan jumlah parameter dalam model, yang tak terhindarkan terjadi ketika Anda memasukkan lebih banyak input, juga meningkatkan risiko jaringan untuk overfit , terutama jika Anda memiliki sedikit data pelatihan.
Namun, ini dapat dibuat menjadi jauh lebih sedikit dari masalah jika metode regularisasi yang baik digunakan. (Dropout tampaknya bekerja sangat baik untuk itu) Secara teoritis, dengan metode regularisasi yang cukup baik, overfitting seharusnya tidak menjadi masalah sama sekali. Seperti yang ditunjukkan Hinton, manusia memiliki urutan 10 ^ 14 sinapsis di otak (sesuai dengan koneksi dalam jaringan saraf), tetapi hanya hidup dalam urutan 10 ^ 9 detik, tetapi kita tampaknya masih dapat menggeneralisasi dengan cukup baik. Jadi jelas, memiliki banyak parameter yang bisa disetel harus dengan algoritma yang tepat hanya menjadi keuntungan.
Halo selamat tinggal
sumber