Bagaimana perbedaan konvolusional berbeda dari jaringan konvolusional biasa?

9

Saat ini saya sedang berupaya menciptakan kembali hasil dari makalah ini . Dalam makalah mereka menggambarkan metode untuk menggunakan CNN untuk ekstraksi fitur, dan memiliki model akustik yaitu Dnn-hmm dan dipra-preline menggunakan RBM.

Bagian III ayat A menyatakan berbagai cara input data dapat direpresentasikan. Saya memutuskan untuk secara vertikal menumpuk plot spektrum dari delta statis, delta dan delta.

Jadi seperti itu: masukkan deskripsi gambar di sini

Makalah ini kemudian menjelaskan bagaimana seharusnya jaringan. Mereka menyatakan bahwa mereka menggunakan jaringan convolutional, tetapi tidak ada tentang struktur jaringan ?. Lebih jauh lagi apakah jaringan selalu disebut sebagai lapisan convolutional? yang saya yakin saya melihat perbedaan dibandingkan dengan jaringan neural convolutional network biasa (cnn).

Makalah ini menyatakan tentang perbedaan:

(dari bagian III ayat B)

Lapisan konvolusi berbeda dari lapisan tersembunyi standar yang terhubung sepenuhnya dalam dua aspek penting. Pertama, setiap unit konvolusional hanya menerima input dari area input lokal. Ini berarti bahwa setiap unit mewakili beberapa fitur dari wilayah input lokal. Kedua, unit lapis konvolusi sendiri dapat diatur ke dalam sejumlah peta fitur, di mana semua unit dalam peta fitur yang sama berbagi bobot yang sama tetapi menerima input dari lokasi berbeda dari lapisan bawah.

Hal lain yang saya pikirkan adalah apakah makalah ini benar-benar menyatakan berapa banyak parameter output yang diperlukan untuk memberi makan model akustik dnn-hmm. Sepertinya saya tidak dapat mendekodekan jumlah filter, ukuran filter .. secara umum rincian jaringan?

Carlton Banks
sumber
Saya juga tertarik dengan ini. Kira saya bisa mulai hadiah untuk mempercepat proses.
Lamda

Jawaban:

4

Tampaknya lapisan konvolusional persis sama dengan lapisan konvolusional biasa. Dari makalah mereka, mereka berpendapat bahwa istilah "lapisan CNN" biasanya mengacu pada lapisan konvolusional diikuti oleh lapisan penyatuan. Dalam upaya untuk mengurangi kebingungan, mereka menyebut bagian konvolusional sebagai "lapisan konvolusi" dan bagian penyatuan sebagai "kumpulan penyatuan":

Dalam terminologi CNN, sepasang konvolusi dan lapisan penyatuan pada Gambar. 2 berturut-turut biasanya disebut sebagai satu "lapisan" CNN. CNN yang dalam dengan demikian terdiri dari dua atau lebih dari pasangan ini secara berturut-turut. Untuk menghindari kebingungan, kita akan merujuk pada konvolusi dan lapisan penyatuan masing-masing sebagai lapisan konvolusi dan penyatuan.

Ironisnya, ini telah meningkatkan kebingungan, mengarah ke pos ini. Pada waktu itu saya kira tidak lazim memiliki beberapa lapisan konvolusional berturut-turut sebelum lapisan penggabungan, tetapi kita sering melihat ini dalam arsitektur modern.

Untuk menjawab pertanyaan Anda yang lain tentang struktur jaringan; mereka menyatakan struktur jaringan yang mereka gunakan di bagian Eksperimen (Bagian VB). Untuk mudah-mudahan mengurangi kebingungan, saya telah mengganti kata "ply" dengan "layer":

Dalam percobaan ini kami menggunakan satu konvolusi [lapisan], satu kumpulan [lapisan] dan dua lapisan tersembunyi yang sepenuhnya terhubung di bagian atas. Lapisan yang terhubung sepenuhnya memiliki 1000 unit di masing-masing. Parameter konvolusi dan penyatuan adalah: ukuran penyatuan 6, ukuran shift 2, ukuran filter 8, 150 peta fitur untuk FWS, dan 80 peta fitur per band frekuensi untuk LWS.

timleathart
sumber