Berapa banyak parameter yang dimiliki oleh satu LSTM bertumpuk? Jumlah parameter memaksakan batas bawah pada jumlah contoh pelatihan yang diperlukan dan juga mempengaruhi waktu pelatihan. Karenanya mengetahui jumlah parameter berguna untuk model pelatihan menggunakan LSTM.
deep-learning
rnn
wabbit
sumber
sumber
Namun jika LSTM Anda termasuk vektor bias, ( ini adalah default dalam keras misalnya ), jumlahnya menjadi:
sumber
Menurut ini :
Struktur sel LSTM
Persamaan LSTM
Ingoring non-linearitas
Jika input x_t adalah ukuran n × 1, dan ada sel memori d , maka ukuran masing-masing W ∗ dan U ∗ adalah d × n , dan d × d resp. Ukuran W kemudian akan menjadi 4d × (n + d) . Perhatikan bahwa masing-masing sel memori dd memiliki bobot sendiri W ∗ dan U ∗ , dan bahwa satu-satunya waktu nilai sel memori dibagi dengan unit LSTM lainnya selama produk dengan U ∗ .
Terima kasih kepada Arun Mallya untuk presentasi yang luar biasa.
sumber