Apa yang dimaksud dengan "permutasi invarian" dalam konteks jaringan saraf yang melakukan pengenalan gambar?

Jawaban:

17

Dalam konteks ini ini merujuk pada fakta bahwa model tidak mengasumsikan hubungan spasial antara fitur. Misalnya untuk perceptron multilayer, Anda dapat mengubah piksel dan kinerjanya akan sama. Ini bukan kasus untuk jaringan konvolusional, yang menganggap hubungan lingkungan.

bayerj
sumber
1
ya, itu bagian yang membingungkan. Bukankah harus ada hubungan spasial dalam mengklasifikasikan angka?
RockTheStar
1
MNIST banyak digunakan sebagai tolok ukur (atau pemeriksaan kewarasan) dalam jaringan saraf. Jika model Anda bisa mendapatkan <1% kesalahan pada permutasi MNIST invarian, Anda ada sesuatu.
bayerj
1
Ya, maksud saya tidak ada hubungan spasial dalam digit juga? Jika Anda mengubah piksel digit, itu akan mengubah urutan piksel, yang pada dasarnya mempengaruhi kinerja !?
RockTheStar
1
Hanya jika model mengasumsikan demikian. mlps tidak, konon lakukan. Itu sebabnya membandingkan convnet ke mlp di mnist agak tidak adil.
bayerj
1
Saya melihat! Jadi, pada dataset mnist, apakah mlps berkinerja lebih baik atau convnet?
RockTheStar
6

fx=(x1,,xn)fxn=3

f((x1,x2,x3))=f((x2,x1,x3))=f((x3,x1,x2))
kjetil b halvorsen
sumber
1
Jawaban ini sedikit menyesatkan, karena dalam pembelajaran mesin algoritma pembelajaran sering permutasi invarian, sedangkan fungsi yang dikembalikan tidak.
bayerj
@bayerj: Itu informasi yang menarik, tapi saya tidak bisa melihat itu membuat definisi yang saya berikan menyesatkan , itu definisi yang benar, tapi mungkin bukan jawaban yang lengkap dalam konteks ini.
kjetil b halvorsen
Anda benar, definisi itu benar. Tetapi itu tidak berlaku dalam cara Anda menuliskannya. Dalam konteks permutasi MNIST invarian, yang ditanyakan oleh OP, fungsi dari bentuk yang Anda tulis tidak terjadi.
bayerj