Bidang Reseptif
The reseptif lapangan , dalam konteks mekanika CNN, adalah rentang diskrit input yang dipilih sebagai masukan untuk kernel konvolusi dari lapisan tertentu. Kisaran bidang reseptif adalah fungsi dari posisi dan ukuran. Rentang ini berlaku untuk satu dimensi atau lebih. 1
- Horisontal
- Vertikal
- Indeks bingkai
- Peningkatan waktu
- Indeks lapisan piksel
- Dimensi lainnya
Posisi bidang reseptif bervariasi secara sistematis untuk memilih subset rentang indeks di setiap dimensi untuk mencakup rentang penuh. 2 Ukurannya cocok dengan input dari kernel yang beroperasi di atasnya dan karenanya biasanya konstan. 3
Ini adalah tiga karakteristik yang menentukan bidang reseptif di CNN.
- Menentukan kisaran indeks yang dipilih untuk input ke dalam konvolusi kernel dalam hal posisi dan ukuran indeks
- Ukuran kisaran indeks di setiap dimensi (biasanya ganjil dan kurang dari 20) cocok dengan karakteristik ukuran input kernel
- Posisi rentang indeks di setiap dimensi, bervariasi secara sistematis untuk mencakup seluruh rentang informasi di semua dimensi, biasanya bervariasi berdasarkan peningkatan yang tetap.
Perhatikan bahwa istilah Bidang Reseptif berasal dari batas representasi sinyal dari bidang visual yang ditangkap dalam sistem biologis. Dalam konteks ini, istilah Bidang Reseptif mengacu pada rentang geometrik yang diperoleh melalui perangkat atau organ pencitraan. Seperti halnya mata dapat memindai lanskap, pemilihan posisi dalam bidang informasi total terjadi dalam desain CNN.
Kesamaan antara biologis dan buatan adalah penggunaan memvariasikan fokus perhatian atas ruang sensorik total.
Peta Fitur sebagai Representasi Fitur yang Diekstraksi
Istilah Feature Map dalam konteks ini adalah peta yang mewakili fitur-fitur yang diekstraksi melalui satu atau lebih lapisan konvolusi. Istilah ini mungkin digunakan secara tidak akurat untuk output menengah kernel, tetapi perhatikan bahwa output lapisan menengah sebelum lapisan yang dikumpulkan belum secara langsung mewakili fitur. Pada tahap-tahap itu, ekstraksi tidak lengkap, jadi tidak ada hubungan langsung antara nilai dan fitur.
Istilah peta fitur paling akurat digunakan ketika menggambarkan output dari lapisan kumpulan terakhir di bagian lapisan CNN. Bagian ini dapat berada dalam urutan bagian CNN atau mungkin merupakan komponen dalam arsitektur sistem yang lebih besar.
Contoh pemetaan fitur termasuk ini.
- Tepi
- Penampilan atau hilangnya (domain temporal)
- Elemen objek
- Lintasan gerak
- Perbesar
- Benda
- Tindakan
Dalam penggunaan istilah ini, pemetaan fitur relatif terhadap dimensi informasi, ruang posisi tempat kernel diterapkan.
Feature Map sebagai Representasi Transform dalam Discrete Hilbert Space
Ketika istilah Feature Map diterapkan pada pemetaan yang dilakukan oleh satu atau satu set lapisan CNN, fitur pada output dipetakan ke input, bukan ke posisi. Dalam konteks ini, pemetaan adalah transformasi tensor di Hilbert Space. Perhatikan bahwa peta bukanlah representasi dari sinyal tetapi representasi dari transformasi, kernel dan parameter yang dipelajari dalam keadaan saat ini.
Untuk menyamarkan konteks ini dari yang sebelumnya, mungkin berguna untuk menggunakan istilah Pemetaan Fitur untuk menunjukkan transformasi tensor daripada output dari transformasi tersebut.
Tumpang tindih Ketentuan
Ketika output dari bagian konvolusi berisi peta fitur dan dimasukkan ke dalam lapisan atau bagian konvolusi lainnya, peta fitur dari satu bagian menjadi ruang penuh tempat bidang reseptif memilih subset informasi yang akan dimasukkan ke dalam kernel berikutnya sebagai memasukkan.
Perhatikan bahwa peta fitur adalah sinyal lengkap yang mewakili semua data di bagian jaringannya, di mana sebagai bidang reseptif paling sering merupakan subset dari sinyal lengkap yang diterapkan beberapa kali untuk mencakup luasnya sinyal penuh dalam berbagai dimensi.
Kedua istilah ini tidak identik dalam konteks apa pun tetapi hanya terkait oleh teori dan praktik.
Catatan kaki
[1] Posisi dan ukuran keduanya ditentukan di masing-masing n dimensi dalam sayandimana n ≥ 1.
[2] Pemilihan rentang dalam setiap dimensi dapat dilakukan melalui pengulangan dalam algoritma atau melalui solusi perangkat keras yang melakukan operasi windowing dengan DSP atau sirkuit GPU, yang mungkin dicapai melalui perangkat keras atau firmware yang dikendalikan oleh operasi RISC paralel.
[3] Contoh dan indeks zaman dapat dibatasi dengan cara yang sama dalam beberapa desain CNN, tetapi indeks tersebut, dalam pengertian istilah yang biasa, tidak dianggap sebagai bagian dari bidang reseptif. Hanya dimensi dalam masing-masing contoh. Juga, indeks aliran input, seperti pengidentifikasi kamera biasanya tidak dimasukkan sebagai dimensi dalam bidang reseptif.