Apa arti penting dari jumlah filter konvolusi dalam jaringan konvolusional?

16

Berapakah jumlah filter dalam lapisan konvolusi?
Bagaimana angka ini mempengaruhi kinerja atau kualitas arsitektur? Maksud saya, haruskah kita selalu memilih jumlah filter yang lebih tinggi? apa yang baik dari mereka? dan Bagaimana orang menetapkan jumlah filter yang berbeda untuk berbagai lapisan? Maksud saya melihat pertanyaan ini: Bagaimana menentukan jumlah operator konvolusional di CNN?
Jawabannya menentukan 3 lapisan konvolusi dengan jumlah filter dan ukuran yang berbeda, Sekali lagi dalam pertanyaan ini: jumlah peta fitur dalam jaringan saraf convolutional Anda dapat melihat dari gambar itu, kami memiliki 28 * 28 * 6 filter untuk lapisan pertama dan 10 * 10 * 16 filter untuk lapisan konv kedua. Bagaimana mereka menemukan angka-angka ini, Apakah ini melalui coba-coba? Terima kasih sebelumnya

Rika
sumber

Jawaban:

8

Berapakah jumlah filter dalam lapisan konvolusi? - Saya biasanya suka menganggap filter sebagai fitur pendeteksi. Walaupun itu tergantung pada domain masalah, signifikansi # dari detektor fitur secara intuitif adalah jumlah fitur (seperti tepi, garis, bagian objek dll ...) yang dapat dipelajari oleh jaringan. Perhatikan juga bahwa setiap filter menghasilkan peta fitur. Peta fitur memungkinkan Anda mempelajari faktor-faktor penjelas di dalam gambar, jadi semakin banyak # filter berarti semakin banyak yang dipelajari jaringan (tidak selalu bagus setiap saat - saturasi dan konvergensi yang paling penting)

Bagaimana angka ini mempengaruhi kinerja atau kualitas arsitektur? - Saya tidak berpikir Anda akan menemukan jawaban yang baik untuk jenis pertanyaan ini karena kami masih berusaha untuk memformalkan apa yang terjadi di dalam kotak hitam DL. Secara intuitif sekali lagi Anda akan mempelajari fungsi non-linear yang lebih kuat, semakin banyak bank filter yang Anda miliki namun kinerjanya akan tergantung pada jenis tugas dan karakteristik data. Anda biasanya ingin mengetahui data seperti apa yang Anda hadapi untuk menentukan # parameter dalam arsitektur Anda (termasuk filter). Berapa banyak filter yang saya butuhkan? lebih seperti menanyakan seberapa kompleks (khusus) gambar dalam dataset saya. Tidak ada gagasan formal yang menghubungkan # filter dengan kinerja. Semuanya eksperimental dan berulang. Banyak jejak dan kesalahan masa depan.

Henok G.
sumber
Jawaban yang bagus, menambah poin di atas: CNN, bagaimanapun, bukan lagi kotak hitam. Anda sebenarnya dapat melihat fitur yang dipelajari oleh peta fitur. Jumlah filter yang Anda tetapkan dalam sebuah lapisan adalah untuk memungkinkan wadah CUKUP untuk jaringan untuk mempelajari fitur yang relevan (atau kombinasinya). Berapa jumlah yang memadai -> tergantung pada dataset. Katakanlah, jaringan CNN pada layer X membutuhkan setidaknya 24 peta fitur untuk mempelajari fitur-fitur penting, jadi Anda memberikan, katakanlah, 32, bekerja dengan ide bahwa Anda memberi ruang pada jaringan dan membiarkannya memutuskan sendiri, mungkin beberapa dari 32 redundan atau sedikit bervariasi.
MANU