Bidang reseptif neuron di LeNet

9

Saya mencoba memahami bidang reseptif CNN dengan lebih baik. Untuk melakukan itu saya ingin menghitung bidang reseptif dari setiap neuron di LeNet. Untuk MLP normal itu agak mudah (lihat http://deeplearning.net/tutorial/lenet.html#sparse-connectivity ), tetapi lebih sulit untuk menghitung bidang reseptif dari neuron dalam lapisan berikut satu atau lebih lapisan konvolusional dan lapisan penyatuan.

Apa bidang reseptif dari neuron dalam 2. lapisan konvolusional? Berapa besar itu di lapisan subsampling / pooling berikut? Dan apa rumus untuk menghitung ini?

pir
sumber
1
Bilah sisi terkait menyarankan pertanyaan ini , yang relevan dengan jenis hal yang Anda pikirkan dan menarik.
Dougal

Jawaban:

2

Jika Anda berpikir tentang jaring konvolusional sebagai turunan dari MLP standar, Anda bisa mengetahui bidang reseptif dengan cara yang persis sama dengan contoh yang Anda tautkan.

Ingatlah bahwa lapisan konvolusional pada dasarnya adalah singkatan untuk lapisan dengan banyak pola berulang, seperti pada gambar ini (dari jawaban ini , berasal dari sini ):

contoh konvolusi visual

Setiap "piksel tujuan" dari gambar tersebut sesuai dengan neuron yang inputnya adalah kotak biru pada gambar sumber. Bergantung pada arsitektur jaringan Anda konvolusi mungkin tidak sama persis dengan piksel seperti itu, tetapi ide yang sama. Bobot yang digunakan sebagai input untuk semua neuron konvolusional terikat, tetapi itu tidak relevan dengan apa yang Anda pikirkan di sini.

Pooling neuron dapat dipikirkan dengan cara yang sama, menggabungkan bidang reseptif dari masing-masing input mereka.

Dougal
sumber
Visualisasi yang bagus! Teladan Anda sangat masuk akal. Jika saya menambahkan lapisan penggabungan 2x2 setelah lapisan konvolusional, maka setiap neuron dalam lapisan penyatuan hanya akan memiliki bidang reseptif 4x4, meskipun mencampur empat bidang 3x3 karena neuron dalam lapisan konvolusional bertumpang tindih. Saya dapat dengan mudah memahami hal ini dan membuat beberapa rumus sederhana untuk bidang reseptif berdasarkan pada ukuran kumpulan dll. Namun, ini menjadi lebih kompleks untuk lapisan konvolusional berikut karena bidang reseptif sekarang juga tergantung pada langkah untuk lapisan pemungutan suara dll. Formula apa untuk RF yang memperhitungkan ini?
pir
jadi apakah kotak biru di piksel sumber ukuran bidang reseptif?
Charlie Parker
Saya memiliki pertanyaan yang sama, dalam makalah "Lebih cepat R-CNN: Menuju Deteksi Objek Real-Time dengan Jaringan Proposal Wilayah", katanya di bagian 3.1, bidang reseptif ZF dan VGG16 adalah 171 dan 228 tetapi tidak menambahkan naik dari konfigurasi jaringan. Semoga ada yang bisa menjernihkan ini untukku.
Chan Kim
0

Dalam Faster-rcnn, bidang penerimaan efektif dapat dihitung sebagai berikut (VGG16):

Img->
Conv1 (3) -> Conv1 (3) -> Pool1 (2) ==>
Conv2 (3) -> Conv2 (3) -> Pool2 (2) ==>
Conv3 (3) -> Conv3 (3) ) -> Conv3 (3) -> Pool3 (2) ==>
Conv4 (3) -> Conv4 (3) -> Conv4 (3) -> Pool4 (2) ==>
Conv5 (3) -> Conv5 (3) ) -> Conv5 (3) ====>
jendela 3 * 3 di peta fitur.
Mari kita ambil satu dimensi untuk kesederhanaan. Jika kita turun kembali dari ukuran 3, bidang penerimaan asli:
1). di awal Conv5: 3 + 2 + 2 + 2 = 9
2). di awal Conv4: 9 * 2 + 2 + 2 + 2 = 24
3). di awal Conv3: 24 * 2 + 2 + 2 + 2 = 54
4). di awal Conv2: 54 * 2 + 2 + 2 = 112
5). di awal Conv1 (input asli): 112 * 2 + 2 + 2 = 228

klub kapal pesiar
sumber