Sebagian besar jaringan saraf convolutional umum mengandung lapisan penyatuan untuk mengurangi dimensi fitur keluaran. Mengapa saya tidak dapat mencapai hal yang sama hanya dengan meningkatkan langkah lapisan konvolusional? Apa yang membuat lapisan pengumpulan diperlukan?
sumber
Rupanya max pooling membantu karena mengekstrak fitur paling tajam dari suatu gambar. Jadi mengingat sebuah gambar, fitur paling tajam adalah representasi tingkat rendah terbaik dari suatu gambar. https://www.quora.com/What-is-the-benefit-of-using-average-pooling-rather-than-max-pooling
Tetapi menurut kuliah Deep Learning Andrew Ng, max pooling bekerja dengan baik tetapi tidak ada yang tahu mengapa. Kutipan -> "Tapi saya harus mengakui, saya pikir alasan utama orang menggunakan max pooling adalah karena telah ditemukan dalam banyak percobaan untuk bekerja dengan baik, ... Saya tidak tahu ada orang yang sepenuhnya tahu apakah itu yang asli alasan yang mendasarinya. "
sumber