DropOut dan DropConnect adalah kedua metode yang dimaksudkan untuk mencegah "co-adaptation" unit dalam jaringan saraf. Dengan kata lain, kami ingin unit mengekstraksi fitur secara independen dari input mereka alih-alih mengandalkan neuron lain untuk melakukannya.
Misalkan kita memiliki jaringan feedforward multilayered seperti ini (topologi tidak terlalu penting). Kami khawatir tentang unit tersembunyi berwarna kuning di adaptasi lapisan tengah.
Keluar
Untuk menerapkan DropOut, kami secara acak memilih subset unit dan menjepit outputnya menjadi nol, terlepas dari inputnya; ini secara efektif menghilangkan unit-unit dari model. Subset unit yang berbeda dipilih secara acak setiap kali kami menyajikan contoh pelatihan.
Di bawah ini adalah dua kemungkinan konfigurasi jaringan. Pada presentasi pertama (kiri), unit ke-1 dan ke-3 dinonaktifkan, tetapi unit ke-2 dan ke-3 telah dipilih secara acak pada presentasi berikutnya. Pada waktu pengujian, kami menggunakan jaringan lengkap tetapi skala ulang bobot untuk mengimbangi kenyataan bahwa semuanya sekarang dapat menjadi aktif (misalnya, jika Anda menjatuhkan setengah dari node, bobot juga harus dikurangi setengahnya).
DropConnect
DropConnect bekerja dengan cara yang sama, kecuali bahwa kami menonaktifkan bobot individu (yaitu, setel ke nol), bukan node, sehingga sebuah node dapat tetap aktif sebagian. Secara skematis, tampilannya seperti ini:
Perbandingan
Kedua metode ini bekerja karena mereka secara efektif membiarkan Anda melatih beberapa model pada saat yang sama, kemudian rata-rata menggunakannya untuk pengujian. Misalnya, layer kuning memiliki empat node, dan dengan demikian 16 kemungkinan status DropOut (semua diaktifkan, # 1 dinonaktifkan, # 1 dan # 2 dinonaktifkan, dll).
DropConnect adalah generalisasi dari DropOut karena ia menghasilkan model yang lebih mungkin, karena hampir selalu ada lebih banyak koneksi daripada unit. Namun, Anda bisa mendapatkan hasil yang serupa pada uji coba individual. Misalnya, jaringan DropConnect di sebelah kanan telah secara efektif menjatuhkan Unit # 2 karena semua koneksi yang masuk telah dihapus.
Bacaan lebih lanjut
Makalah asli cukup mudah diakses dan berisi lebih banyak detail dan hasil empiris.