Berapakah jumlah filter dalam lapisan konvolusi?
Bagaimana angka ini mempengaruhi kinerja atau kualitas arsitektur? Maksud saya, haruskah kita selalu memilih jumlah filter yang lebih tinggi? apa yang baik dari mereka? dan Bagaimana orang menetapkan jumlah filter yang berbeda untuk berbagai lapisan? Maksud saya melihat pertanyaan ini: Bagaimana menentukan jumlah operator konvolusional di CNN?
Jawabannya menentukan 3 lapisan konvolusi dengan jumlah filter dan ukuran yang berbeda, Sekali lagi dalam pertanyaan ini: jumlah peta fitur dalam jaringan saraf convolutional
Anda dapat melihat dari gambar itu, kami memiliki 28 * 28 * 6 filter untuk lapisan pertama dan 10 * 10 * 16 filter untuk lapisan konv kedua. Bagaimana mereka menemukan angka-angka ini, Apakah ini melalui coba-coba? Terima kasih sebelumnya
16
Jawaban:
Berapakah jumlah filter dalam lapisan konvolusi? - Saya biasanya suka menganggap filter sebagai fitur pendeteksi. Walaupun itu tergantung pada domain masalah, signifikansi # dari detektor fitur secara intuitif adalah jumlah fitur (seperti tepi, garis, bagian objek dll ...) yang dapat dipelajari oleh jaringan. Perhatikan juga bahwa setiap filter menghasilkan peta fitur. Peta fitur memungkinkan Anda mempelajari faktor-faktor penjelas di dalam gambar, jadi semakin banyak # filter berarti semakin banyak yang dipelajari jaringan (tidak selalu bagus setiap saat - saturasi dan konvergensi yang paling penting)
Bagaimana angka ini mempengaruhi kinerja atau kualitas arsitektur? - Saya tidak berpikir Anda akan menemukan jawaban yang baik untuk jenis pertanyaan ini karena kami masih berusaha untuk memformalkan apa yang terjadi di dalam kotak hitam DL. Secara intuitif sekali lagi Anda akan mempelajari fungsi non-linear yang lebih kuat, semakin banyak bank filter yang Anda miliki namun kinerjanya akan tergantung pada jenis tugas dan karakteristik data. Anda biasanya ingin mengetahui data seperti apa yang Anda hadapi untuk menentukan # parameter dalam arsitektur Anda (termasuk filter). Berapa banyak filter yang saya butuhkan? lebih seperti menanyakan seberapa kompleks (khusus) gambar dalam dataset saya. Tidak ada gagasan formal yang menghubungkan # filter dengan kinerja. Semuanya eksperimental dan berulang. Banyak jejak dan kesalahan masa depan.
sumber