Saya tahu bahwa arsitektur jaringan saraf sebagian besar didasarkan pada masalah itu sendiri dan jenis input / output, tetapi masih - selalu ada "yang persegi" ketika mulai membangun satu. Jadi pertanyaan saya adalah - diberikan dataset input MxN (M adalah jumlah catatan, N adalah jumlah fitur) dan kelas keluaran C yang mungkin - apakah ada aturan praktis tentang berapa banyak layer / unit yang harus kita mulai?
neural-network
shakedzy
sumber
sumber
Jawaban:
Pertanyaan ini telah dijawab secara terperinci di CrossValidated: Bagaimana memilih jumlah layer dan node tersembunyi dalam jaringan neural feedforward?
Namun, izinkan saya menambahkan dua sen saya sendiri:
Tidak ada aturan ajaib untuk memilih arsitektur jaringan saraf terbaik, tetapi jika Anda dapat menemukan arsitektur yang digunakan seseorang untuk memecahkan masalah yang sama, ini sering merupakan titik awal yang sangat baik.
Tempat terbaik untuk melihat adalah contoh resmi atau tidak resmi menggunakan perpustakaan jaringan saraf populer seperti Keras, PyTorch, atau Tensorflow, dan arsitektur yang dijelaskan dalam literatur akademik. keras / contoh di github adalah sumber yang bagus.
Arsitektur ini kemungkinan dipilih setelah banyak trial and error, sehingga sebagian besar pekerjaan akan dilakukan untuk Anda.
sumber
Saya membaca makalah yang mengeksplorasi ide menggunakan jaringan saraf untuk merancang jaringan saraf lain, dengan menjelajahi konfigurasi node dan layer mana yang paling efisien. Inilah halaman di mana Anda dapat mengunduh PDF https://arxiv.org/abs/1611.02120
sumber
Mengikuti jawaban @ Imran, saya menemukan makalah ini di salah satu komentar di postingan CrossValidated yang dia tautkan. Selain upaya untuk menemukan arsitektur yang tepat menggunakan Model Genetik (alih-alih menggunakan aturan praktis), bagian 2.1 memberikan beberapa batasan teoretis tentang berapa banyak unit tersembunyi yang harus ada dalam sistem lapisan tersembunyi satu / dua.
EDIT: Saya sudah menguji teorema ini , dan menemukan bahwa menggunakan Model Genetik sama baiknya dengan memilih arsitektur acak.
sumber