Saya memiliki arsitektur jaringan dari kertas "belajar kesamaan gambar berbutir halus dengan peringkat dalam" dan saya tidak dapat mengetahui bagaimana output dari tiga jaringan paralel digabungkan menggunakan lapisan embedding linier. Satu-satunya informasi yang diberikan pada lapisan ini, di koran adalah
Akhirnya, kami menormalkan embeddings dari tiga bagian, dan menggabungkannya dengan lapisan embedding linier. Dimensi embedding adalah 4096.
Adakah yang bisa membantu saya dalam mencari tahu apa sebenarnya yang dimaksud penulis ketika ia berbicara tentang lapisan ini?
neural-network
deep-network
A. Sam
sumber
sumber
Jawaban:
Linear embedding layer harus hanya nama yang bagus untuk lapisan padat tanpa aktivasi. 'Linear' berarti tidak ada aktivasi (aktivasi adalah identitas). Dan embedding lebih merupakan konsep untuk representasi vektor dari data input (mis. Embeddings kata). Saya percaya elemen dari vektor kedua hanya ditambahkan ke elemen pertama.
sumber
Disebutkan di koran:
Mereka mengambil setiap bagian dari model dan menormalkannya secara terpisah.
Adapun menggabungkan mereka, seperti yang Anda komentari, untuk menangkap fitur yang paling menonjol, dengan representasi yang kurang lengkap tidak perlu untuk non-linearitas.
sumber