Saya sangat baru dalam belajar dan saya sangat tertarik untuk mengetahui apa itu LSTM dan BiLSTM dan kapan menggunakannya (area aplikasi utama). Mengapa LSTM dan BILSTM lebih populer daripada RNN?
Bisakah kita menggunakan arsitektur pembelajaran yang mendalam ini dalam masalah yang tidak diawasi?
Jawaban:
RNN
arsitektur menyukaiLSTM
danBiLSTM
digunakan pada saat-saat di mana masalah pembelajarannya berurutan, misalnya Anda memiliki video dan Anda ingin tahu apa itu semua tentang atau Anda ingin agen membaca baris dokumen untuk Anda yang merupakan gambar teks dan tidak dalam format teks. Saya sangat menyarankan Anda melihat di sini .LSTMs
dan varian dua arah mereka populer karena mereka telah mencoba mempelajari bagaimana dan kapan untuk melupakan dan kapan tidak menggunakan gerbang dalam arsitektur mereka. DalamRNN
arsitektur sebelumnya , menghilangkan gradien adalah masalah besar dan menyebabkan jaring-jaring itu tidak terlalu banyak belajar.Menggunakan Bidirectional
LSTMs
, Anda memberi makan algoritma pembelajaran dengan data asli satu kali dari awal hingga akhir dan sekali dari ujung ke awal. Ada perdebatan di sini tetapi biasanya belajar lebih cepat daripada pendekatan satu arah meskipun tergantung pada tugas.Ya, Anda dapat menggunakannya dalam pembelajaran tanpa pengawasan juga tergantung pada tugas Anda. lihat di sini dan di sini .
sumber
Manusia tidak memulai pemikiran mereka dari awal setiap detik. Saat Anda membaca esai ini, Anda memahami setiap kata berdasarkan pada pemahaman Anda tentang kata-kata sebelumnya. Anda tidak membuang segalanya dan mulai berpikir dari awal lagi. Pikiran Anda memiliki kegigihan.
Jaringan saraf tradisional tidak bisa melakukan ini, dan sepertinya kekurangan besar. Misalnya, bayangkan Anda ingin mengklasifikasikan acara seperti apa yang terjadi di setiap titik dalam film. Tidak jelas bagaimana jaringan saraf tradisional dapat menggunakan alasannya tentang peristiwa sebelumnya dalam film untuk menginformasikan yang kemudian.
Jaringan saraf berulang mengatasi masalah ini. Mereka adalah jaringan dengan loop di dalamnya, memungkinkan informasi untuk bertahan.
Untuk membaca lebih lanjut, kunjungi Blog Cohen
sumber
Dibandingkan dengan LSTM,
BLSTM
atauBiLSTM
memiliki dua jaringan, satu aksespast
informasi keforward
arah dan satu lagi aksesfuture
kereverse
arah. WIKIKelas baru
Bidirectional
ditambahkan sesuai dokumen resmi di sini :Contoh lengkap menggunakan data IMDB akan seperti ini
sumber