Cukup intuitif bahwa sebagian besar topologi / arsitektur jaringan saraf tidak dapat diidentifikasi. Tapi apa saja hasil yang terkenal di lapangan? Apakah ada kondisi sederhana yang memungkinkan / mencegah pengidentifikasian? Sebagai contoh,
- semua jaringan dengan fungsi aktivasi nonlinear dan lebih dari satu lapisan tersembunyi tidak dapat diidentifikasi
- semua jaringan dengan lebih dari dua unit tersembunyi tidak dapat diidentifikasi
Atau hal-hal seperti ini. CATATAN : Saya tidak mengatakan bahwa kondisi ini mencegah pengidentifikasian (meskipun mereka sepertinya kandidat yang cukup baik bagi saya). Mereka hanyalah contoh dari apa yang saya maksud dengan "kondisi sederhana".
Jika ini membantu mempersempit pertanyaan, silakan mempertimbangkan hanya arsitektur umpan-maju dan berulang. Jika ini masih belum cukup, saya akan puas dengan jawaban yang mencakup setidaknya satu arsitektur di antara MLP, CNN dan RNN. Saya sempat melihat-lihat di Web tapi sepertinya satu-satunya diskusi yang saya temukan adalah di Reddit. Ayo, teman-teman, kita bisa melakukan lebih baik daripada Reddit ;-)
Jawaban:
FFN linear satu lapis tidak diidentifikasi
Pertanyaan yang telah diedit untuk mengecualikan kasus ini; Saya menyimpannya di sini karena memahami kasus linear adalah contoh sederhana dari fenomena yang menarik.
Pertimbangkan jaringan saraf umpan maju dengan 1 lapisan tersembunyi dan semua aktivasi linier. Tugas ini adalah tugas regresi OLS sederhana.
Jadi kita punya modelnyay^= XA B dan tujuannya adalah
untuk beberapa pilihanA , B bentuk yang sesuai. SEBUAH adalah bobot input-ke-tersembunyi, dan B adalah bobot tersembunyi-ke-keluaran.
Jelas bahwa elemen-elemen dari matriks berat tidak dapat diidentifikasi secara umum, karena ada sejumlah konfigurasi yang memungkinkan dimana dua pasang matriksA , B memiliki produk yang sama.
FFN non- linier, single-layer masih belum teridentifikasi
Membangun dari FFN linear, satu-layer, kami juga dapat mengamati non-pengidentifikasian dalam FFN non- linier , single-layer.
Sebagai contoh, menambahkan atanh nonlinier ke salah satu aktivasi linier menciptakan jaringan nonlinear. Jaringan ini masih belum teridentifikasi, karena untuk setiap nilai kerugian, permutasi dari bobot dua (atau lebih) neuron pada satu lapisan, dan neuron yang sesuai pada lapisan berikutnya, juga akan menghasilkan nilai kerugian yang sama .
Secara umum, jaringan saraf tidak diidentifikasi
Kita dapat menggunakan alasan yang sama untuk menunjukkan bahwa jaringan saraf tidak diidentifikasi dalam semua parameterisasi yang sangat khusus.
Misalnya, tidak ada alasan khusus bahwa filter konvolusional harus terjadi dalam urutan tertentu. Juga tidak diperlukan bahwa filter konvolusional memiliki tanda khusus, karena bobot berikutnya dapat memiliki tanda sebaliknya untuk "membalikkan" pilihan itu.
Demikian juga, unit dalam RNN dapat diijinkan untuk mendapatkan kerugian yang sama.
Lihat juga: Bisakah kita menggunakan MLE untuk memperkirakan bobot Jaringan Saraf Tiruan?
sumber
Setidaknya adan ! optima global ketika memasang jaringan saraf 1-lapisan, terdiri dari n neuron. Ini berasal dari fakta bahwa, jika Anda bertukar dua neuron pada level tertentu, dan kemudian Anda bertukar bobot yang dikaitkan dengan neuron ini pada level berikutnya, Anda akan mendapatkan kecocokan yang sama persis.
sumber