Apakah kemampuan pengenalan pola CNN terbatas pada pemrosesan gambar?

21

Dapatkah Jaringan Syaraf Konvolusional digunakan untuk pengenalan pola dalam domain masalah di mana tidak ada gambar yang sudah ada, katakan dengan merepresentasikan data abstrak secara grafis? Apakah itu selalu kurang efisien?

Pengembang ini mengatakan pengembangan saat ini dapat melangkah lebih jauh tetapi tidak jika ada batasan di luar pengenalan gambar.

dynrepsys
sumber
1
Saya melihat setidaknya dua pertanyaan di sini. Bagaimana menurut Anda tentang berpisah? Selain itu, pertanyaannya akan memiliki kualitas yang jauh lebih tinggi jika Anda dapat memperluas apa yang Anda cari dengan pertanyaan judul.
Eric Platon
@EricPlaton Mengencangkannya sedikit. Pertanyaan utama saya adalah tentang sifat hubungan antara CNN dan gambar. Apa saran Anda untuk pertanyaan kedua?
dynrepsys
Terima kasih, pertanyaannya bagus untuk saya (walaupun saya harus menghapus jawaban saya sekarang ~). Adapun pertanyaan kedua, bagaimana dengan pendekatan "apa itu tangkapan"? "Apakah selalu kurang efisien?" masih baik jika seseorang dapat memberikan contoh tandingan.
Eric Platon
Oleh "Bisakah Jaringan Nevolusioner Konvolusional digunakan untuk pengenalan pola dalam domain masalah di mana tidak ada gambar yang sudah ada, katakan dengan mewakili data abstrak secara grafis?" apakah Anda bertanya apakah kami dapat mewakili data sebagai gambar dan menerapkan CNN? Suka membaca dataset 100-fitur dan menggambarkannya sebagai gambar 10x10?
rcpinto

Jawaban:

10

Convolutional Nets (CNN) mengandalkan konvolusi matematis (misalnya konvolusi 2D atau 3D), yang biasa digunakan untuk pemrosesan sinyal. Gambar adalah jenis sinyal, dan konvolusi dapat digunakan secara setara pada suara, getaran, dll. Jadi, pada prinsipnya, CNN dapat menemukan aplikasi untuk sinyal apa pun, dan mungkin lebih.

Dalam praktiknya, sudah ada yang bekerja pada NLP (seperti yang disebutkan oleh Matthew Graves), di mana beberapa orang memproses teks dengan CNN daripada jaringan rekursif. Beberapa karya lain berlaku untuk pemrosesan suara (tidak ada referensi di sini, tapi saya belum menerbitkan karya yang sedang berlangsung).


Konten asli: Sebagai jawaban atas pertanyaan judul asli, yang telah berubah sekarang. Mungkin perlu menghapus yang ini .

Penelitian pada jaringan permusuhan (dan yang terkait) menunjukkan bahwa bahkan jaringan yang dalam dapat dengan mudah dibodohi , mengarahkan mereka untuk melihat seekor anjing (atau benda apa pun) dalam apa yang tampaknya merupakan suara acak ketika manusia melihatnya (artikel tersebut memiliki contoh yang jelas).

Masalah lain adalah kekuatan generalisasi dari jaringan saraf. Jaring konvolusional telah memukau dunia dengan kemampuan mereka untuk menggeneralisasi jauh lebih baik daripada teknik lainnya. Tetapi jika jaringan hanya mengumpankan gambar kucing, ia hanya akan mengenali kucing (dan mungkin melihat kucing di mana-mana, seperti hasil jaringan permusuhan). Dengan kata lain, bahkan CN mengalami kesulitan menyamaratakan terlalu jauh dari apa yang mereka pelajari.

Batas pengakuan sulit untuk didefinisikan secara tepat. Saya hanya akan mengatakan bahwa keragaman data pembelajaran mendorong batas (saya menganggap detail lebih lanjut harus mengarah ke tempat yang lebih tepat untuk diskusi).

Eric Platon
sumber
5

Jawaban sederhananya adalah "tidak, mereka tidak terbatas pada gambar": CNN juga digunakan untuk pemrosesan bahasa alami. (Lihat di sini untuk pengantar.)

Saya belum melihatnya diterapkan pada data grafis, tetapi saya belum melihat; ada beberapa hal yang jelas untuk dicoba dan saya optimis itu akan berhasil.

Matthew Graves
sumber
3

Jaringan saraf convolutional dapat diterapkan tidak hanya untuk pengenalan gambar tetapi juga untuk analisis dan pengakuan video, pemrosesan bahasa alami, dalam permainan (misalnya Go ) atau bahkan untuk penemuan obat dengan memprediksi interaksi antara molekul dan wiki protein biologis .

Oleh karena itu dapat digunakan untuk berbagai masalah dengan menggunakan lapisan convolutional dan subsampling yang terhubung ke lapisan yang lebih terhubung sepenuhnya. Mereka lebih mudah dilatih, karena memiliki lebih sedikit parameter daripada jaringan yang terhubung penuh dengan jumlah unit tersembunyi yang sama. UFLDL

kenorb
sumber
3

Jaringan saraf convolutional dapat digunakan di mana pola berkorelasi dan diterjemahkan secara lokal (seperti dalam shiftable). Ini terjadi karena CNN berisi filter yang mencari pola lokal tertentu di mana pun di input. Anda akan menemukan pola lokal dan terjemahan dalam gambar, teks, seri waktu, dll.

Tidak masuk akal untuk menggunakan CNN jika data Anda lebih seperti sekumpulan fitur dengan urutan yang tidak relevan. Dalam hal ini, Anda mungkin mengalami masalah dalam mendeteksi pola yang berisi fitur yang terpisah lebih jauh dalam vektor input Anda. Anda tidak akan menemukan pola lokal dan yang dapat diterjemahkan dalam data Anda jika Anda dapat menyusun ulang titik data dari vektor input tanpa kehilangan informasi.

BlindKungFuMaster
sumber