Ini dengan merujuk pada kertas Pelokalan Objek Efisien Menggunakan Jaringan Konvolusional , dan dari apa yang saya pahami dropout diimplementasikan dalam 2D.
Setelah membaca kode dari Keras tentang bagaimana Dropout 2D Spasial diimplementasikan, pada dasarnya bentuk biner acak [batch_size, 1, 1, num_channels] diimplementasikan. Namun, apa sebenarnya yang dilakukan Dropout 2D spasial ini ke blok konvolusi input [batch_size, tinggi, lebar, num_channels]?
Dugaan saya saat ini adalah bahwa untuk setiap piksel, jika salah satu lapisan / saluran piksel memiliki nilai negatif, seluruh saluran dari satu piksel tersebut akan disetel ke nol. Apakah ini benar?
Namun, jika dugaan saya benar, maka bagaimana cara menggunakan topeng biner bentuk [batch_size, tinggi, lebar, num_channels] yang persis dalam dimensi blok input asli memberikan dropout elemen-bijaksana seperti biasa (ini sesuai dengan Implementasi dropout asli tensorflow yang menetapkan bentuk topeng biner sebagai bentuk input)? Karena itu berarti jika ada pixel di blok conv negatif, maka seluruh blok conv akan default ke 0. Ini adalah bagian yang membingungkan saya tidak begitu mengerti.
sumber