Apa sebenarnya blok Pembelajaran Residual dalam konteks Deep Residual Networks in Deep Learning?

12

Saya membaca makalah Deep Residual Learning untuk Pengenalan Gambar dan saya mengalami kesulitan memahami dengan kepastian 100% apa yang diperlukan oleh blok residual secara komputasi. Membaca makalah mereka, mereka memiliki angka 2:

masukkan deskripsi gambar di sini

yang menggambarkan apa yang seharusnya menjadi Blok Residual. Apakah perhitungan blok residu sama dengan:

y=σ(W2σ(W1x+b1)+b2+x)

Atau itu sesuatu yang lain?

Dengan kata lain mungkin untuk mencoba mencocokkan notasi kertas, adalah:

F(x)+x=[W2σ(W1x+b1)+b2]+x

Benarkah itu?

y

σ(F(x)+x)=σ([W2σ(W1x+b1)+b2]+x)

σ

Charlie Parker
sumber
is x is positive relu (x) = x
Ray Tayek

Jawaban:

5

Ya itu benar, Anda dapat melihat model caffe mereka untuk melihat bagaimana itu diterapkan.

dontloo
sumber