Pertanyaan Anda cukup luas, tetapi berikut adalah beberapa kiat:
Untuk jaringan feedforward, lihat pertanyaan ini :
Jawaban @ doug telah bekerja untuk saya. Ada satu aturan tambahan yang membantu untuk masalah pembelajaran yang diawasi. Batas atas jumlah neuron tersembunyi yang tidak akan menyebabkan pemasangan berlebihan adalah:
Nh= Ns( α ∗ ( Nsaya+ NHai) )
NsayaNHaiNsα
a l p h aNs∗ ( Nsaya+ NHai)α
Untuk prosedur otomatis Anda akan mulai dengan alpha 2 (dua kali lebih banyak derajat kebebasan dalam data pelatihan Anda sebagai model Anda) dan bekerja hingga 10 jika kesalahan untuk data pelatihan secara signifikan lebih kecil daripada untuk validasi silang kumpulan data.
Dan khususnya pada LSTM, Anda mungkin ingin memeriksa ini .
Tetapi poin utama: tidak ada aturan untuk jumlah node tersembunyi yang harus Anda gunakan, itu adalah sesuatu yang Anda harus mencari tahu untuk setiap kasus dengan coba-coba .
Secara umum, tidak ada pedoman tentang cara menentukan jumlah lapisan atau jumlah sel memori dalam LSTM.
Jumlah lapisan dan sel yang diperlukan dalam LSTM mungkin tergantung pada beberapa aspek masalah:
The Kompleksitas dari dataset. Jumlah fitur, jumlah titik data dll.
Proses menghasilkan data. Contoh berikut tentang bagaimana proses menghasilkan data dapat memainkan peran penting.
Ex - Prediksi harga minyak dibandingkan dengan prediksi PDB ekonomi yang dipahami dengan baik. Yang terakhir ini jauh lebih mudah daripada yang pertama. Dengan demikian, memprediksi harga minyak mungkin juga membutuhkan lebih banyak sel memori LSTM untuk memprediksi dengan akurasi yang sama dibandingkan dengan PDB.
Saya mengikuti langkah-langkah ini ketika memodelkan menggunakan LSTM:
Coba satu lapisan tersembunyi dengan 2 atau 3 sel memori. Lihat kinerjanya terhadap tolok ukur. Jika itu adalah masalah deret waktu maka saya biasanya membuat perkiraan dari teknik deret waktu klasik sebagai patokan.
Coba dan tambah jumlah sel memori. Jika kinerjanya tidak meningkat banyak maka beralihlah ke langkah berikutnya.
Mulailah membuat jaringan yang dalam yaitu menambah lapisan lain dengan sejumlah kecil sel memori.
Selain:
Tidak ada batasan jumlah tenaga kerja yang dapat dikhususkan untuk mencapai minimum global dari fungsi kerugian dan menyesuaikan parameter hiper terbaik. Jadi, memiliki fokus pada tujuan akhir untuk pemodelan harus menjadi strategi daripada berusaha meningkatkan akurasi sebanyak mungkin.
Sebagian besar masalah dapat ditangani menggunakan 2-3 lapisan jaringan.
sumber
Mungkin Anda harus melihat ini: https://wiki.inf.ed.ac.uk/twiki/pub/CSTR/ListenTerm1201415/sak2.pdf
Di sini mereka menunjukkan bahwa 2 lapisan bagus, 5 lapisan lebih baik dan 7 lapisan sangat sulit untuk dilatih.
sumber