Misalkan saya memberi makan matriks 2D bentuk (99,13) sebagai input ke lapisan LSTM. Saya memiliki n jumlah file, di mana masing-masing berisi vektor ukuran (99,13). Saya telah memutuskan untuk mempertimbangkan 13 sebagai jumlah fitur dan 99 sebagai catatan waktu.
(Saat menerapkan dengan Keras, saya telah menambahkan layer LSTM sebagai layer pertama. Dan saya telah menetapkan output_dim dari layer tersebut menjadi 100)
Tetapi saya tidak dapat mengetahui bagaimana hal-hal benar-benar dalam jaringan ketika kami memberikan input seperti di atas. Saya memiliki pertanyaan-pertanyaan berikut, yang tidak dapat saya jawab sendiri.
- Apa jenis nilai-nilai yang kita berikan sebagai masukan ke sel LSTM? ( xt , ht-1 digunakan sebagai input ke sel selalu vektor? Dalam kasus saya apakah xt memiliki bentuk [1,13]?)
- Ketika kita mengatakan kita memiliki lapisan LSTM sebagai lapisan pertama dari mode l, apakah itu memberi makan vektor input pertama ke semua sel di lapisan yang diberikan? (Misalnya: mengumpankan bingkai pertama ukuran 13 (dari 99 bingkai) ke semua n sel LSTM di lapisan pertama?) Demikian juga apakah ia terus memberi makan semua baris matriks input pada setiap langkah waktu?
- Apa jenis nilai tidak output sel LSTM di setiap timestep ? (Apakah kita menganggap keadaan sel sebagai output yang benar dari node? Apakah itu nilai tunggal atau vektor? Jika itu vektor, apa dimensi? Apakah ada cara kita dapat menebak dimensi? Saya menganggap ht sebagai vektor)
- Apa yang dimaksud dengan output_dim (dimensi keluaran) dari lapisan yang diberikan? Apakah harus selalu jumlah node di lapisan berikutnya?
Harap jangan menunda ini atau mengarahkan ke grup lain. Saya pikir pertanyaan-pertanyaan ini terkait dengan pembelajaran mesin dan rnn. Saya telah membaca makalah penelitian, tetapi saya belum dapat memiliki gagasan yang jelas tentang bagaimana sebenarnya pekerjaan di dalam jaringan LSTM.
sumber