Pertanyaan yang diberi tag deep-learning

13

Mengapa penguatan yang dalam belajar tidak stabil?

Dalam makalah DeepMind tahun 2015 tentang pembelajaran penguatan dalam, ia menyatakan bahwa "Upaya sebelumnya untuk menggabungkan RL dengan jaringan saraf sebagian besar gagal karena pembelajaran yang tidak stabil". Makalah ini kemudian mencantumkan beberapa penyebabnya, berdasarkan korelasi antar...

13

Mengapa algoritma keturunan “Saddle-Free Newton” tidak digunakan dalam praktik?

Baru-baru ini saya telah membaca makalah oleh Yann Dauphin et al. Mengidentifikasi dan menyerang masalah saddle point dalam optimasi non-cembung dimensi tinggi , di mana mereka memperkenalkan algoritma keturunan yang menarik yang disebut Saddle-Free Newton , yang tampaknya dirancang khusus untuk...

optimization deep-learning gradient-descent

13

Cara melatih lapisan deep-network LSTM

Saya menggunakan jaringan lstm dan umpan-maju untuk mengklasifikasikan teks. Saya mengonversi teks menjadi vektor satu-panas dan mengumpankan masing-masing ke dalam lstm sehingga saya dapat meringkasnya sebagai satu representasi. Lalu saya memberinya makan ke jaringan lain. Tapi bagaimana cara...

classification neural-networks deep-learning lstm

13

Bagaimana tepatnya jaringan saraf convolutional menggunakan konvolusi menggantikan multiplikasi matriks?

Saya sedang membaca Buku Yoshua Bengio tentang pembelajaran mendalam dan dikatakan di halaman 224: Jaringan konvolusional hanyalah jaringan saraf yang menggunakan konvolusi sebagai pengganti perkalian matriks umum dalam setidaknya satu lapisannya. Namun, saya tidak 100% yakin bagaimana...

machine-learning neural-networks deep-learning convolution

13

Dapatkah jaringan saraf (mis., Jaringan saraf konvolusional) memiliki bobot negatif?

Apakah mungkin untuk memiliki bobot negatif (setelah zaman yang cukup) untuk jaringan saraf convolutional yang mendalam ketika kita menggunakan ReLU untuk semua lapisan

machine-learning neural-networks deep-learning conv-neural-network

13

Mencegah overfitting LSTM pada dataset kecil

Saya memodelkan 15.000 tweet untuk prediksi sentimen menggunakan LSTM lapisan tunggal dengan 128 unit tersembunyi menggunakan representasi seperti word2vec dengan 80 dimensi. Saya mendapatkan akurasi keturunan (38% dengan acak = 20%) setelah 1 zaman. Lebih banyak pelatihan membuat akurasi validasi...

deep-learning regularization overfitting lstm

13

Apakah ada alat visual untuk merancang dan menerapkan jaring saraf / pembelajaran mendalam? [Tutup]

Tutup. Pertanyaan ini di luar topik . Saat ini tidak menerima jawaban. Ingin meningkatkan pertanyaan ini? Perbarui pertanyaan sehingga sesuai topik untuk Cross Validated. Ditutup 10 bulan lalu . Saya tahu ada banyak perpustakaan untuk pembelajaran...

neural-networks deep-learning conv-neural-network

13

Apa saja teknik augmentasi data yang berguna untuk jaringan saraf convolutional yang mendalam?

Latar belakang: Saya baru-baru ini memahami pada tingkat yang lebih dalam pentingnya augmentasi data ketika melatih jaringan saraf convolutional setelah melihat pembicaraan luar biasa ini oleh Geoffrey Hinton . Dia menjelaskan bahwa jaringan saraf convolutional generasi saat ini tidak dapat...

machine-learning deep-learning

13

Model Google Inception: mengapa ada beberapa softmax?

Topologi model Google Inception dapat ditemukan di sini: Google Inception Netowrk Saya perhatikan ada 3 lapisan softmax dalam model ini (# 154, # 152, # 145), dan 2 di antaranya adalah semacam pelarian awal model ini. Dari yang saya tahu, lapisan softmax adalah untuk hasil akhir, jadi mengapa ada...

deep-learning conv-neural-network

13

Apa arti "ujung ke ujung" dalam metode pembelajaran yang mendalam?

Saya ingin tahu apa itu, dan apa bedanya dengan ensembling? Misalkan, saya ingin mencapai akurasi tinggi dalam klasifikasi dan segmentasi, untuk tugas tertentu, jika saya menggunakan jaringan yang berbeda, seperti CNN, RNN, dll untuk mencapai ini, apakah ini disebut model ujung ke ujung?...

machine-learning terminology deep-learning

13

Apakah pembelajaran yang mendalam bermanfaat untuk optimasi kombinatorial?

Apakah ada kelompok penelitian yang berupaya menggunakan pembelajaran yang mendalam untuk masalah optimisasi kombinatorial?

optimization deep-learning

13

Apa itu Bayesian Deep Learning?

Apa itu Bayesian Deep Learning dan bagaimana hubungannya dengan statistik Bayesian tradisional dan Deep Learning tradisional? Apa konsep dan matematika utama yang terlibat? Bisakah saya mengatakan itu hanya statistik bayesian non parametrik? Apa karya seminalnya serta perkembangan dan aplikasi...

bayesian deep-learning

13

Mengapa jaringan saraf mudah tertipu?

Saya telah membaca beberapa makalah tentang membuat gambar secara manual untuk "mengelabui" jaringan saraf (lihat di bawah). Apakah ini karena jaringan hanya memodelkan probabilitas bersyarat ? Jika jaringan dapat memodelkan probabilitas gabungan , akankah kasus seperti itu masih terjadi?p ( y|...

machine-learning neural-networks deep-learning

12

Non-linearitas sebelum lapisan Softmax akhir dalam jaringan saraf convolutional

Saya sedang belajar dan mencoba menerapkan jaringan saraf convolutional, tetapi saya kira pertanyaan ini berlaku untuk perceptrons multilayer secara umum. Neuron keluaran di jaringan saya mewakili aktivasi setiap kelas: neuron paling aktif sesuai dengan kelas prediksi untuk input yang diberikan....

neural-networks deep-learning conv-neural-network nonlinear softmax

12

Matriks berupa backpropagation dengan normalisasi batch

Normalisasi batch telah dikreditkan dengan peningkatan kinerja substansial dalam jaring saraf yang dalam. Banyak materi di internet menunjukkan cara mengimplementasikannya berdasarkan aktivasi-demi-aktivasi. Saya sudah menerapkan backprop menggunakan aljabar matriks, dan mengingat bahwa saya...

machine-learning neural-networks deep-learning backpropagation batch-normalization

12

Memilih ukuran filter, langkah dll dalam CNN?

Saya telah melihat ceramah CS231N dari Stanford dan saya mencoba untuk membungkus kepala saya di beberapa masalah dalam arsitektur CNN. Apa yang saya coba pahami adalah jika ada beberapa pedoman umum untuk memilih ukuran filter konvolusi dan hal-hal seperti langkah atau apakah ini lebih merupakan...

neural-networks deep-learning conv-neural-network

12

Memotivasi unit output sigmoid dalam jaringan saraf dimulai dengan probabilitas log yang tidak normal linear dalam

Latar Belakang: Saya sedang mempelajari Bab 6 Pembelajaran Jauh oleh Ian Goodfellow dan Yoshua Bengio dan Aaron Courville. Pada bagian 6.2.2.2 (halaman 182 dari 183 yang dapat dilihat di sini ) penggunaan sigmoid untuk output termotivasi.P( y= 1 | x )P(y=1|x)P(y=1|x) Untuk meringkas beberapa...

neural-networks deep-learning

12

Arsitektur saraf: desain otomatis informasi-informasi

Kemajuan baru-baru ini dalam jaringan saraf dirangkum oleh urutan arsitektur novel yang ditandai terutama dengan kompleksitas desain yang berkembang. Dari LeNet5 (1994) hingga AlexNet (2012), hingga Overfeat (2013) dan GoogleLeNet / Inception (2014) dan seterusnya ... Apakah ada upaya untuk...

neural-networks deep-learning

12

Apa sebenarnya blok Pembelajaran Residual dalam konteks Deep Residual Networks in Deep Learning?

Saya membaca makalah Deep Residual Learning untuk Pengenalan Gambar dan saya mengalami kesulitan memahami dengan kepastian 100% apa yang diperlukan oleh blok residual secara komputasi. Membaca makalah mereka, mereka memiliki angka 2: yang menggambarkan apa yang seharusnya menjadi Blok Residual....

machine-learning neural-networks deep-learning conv-neural-network residual-networks

12

Apa perbedaan antara regresi linier 'reguler' dan regresi linier deep learning?

Saya ingin tahu perbedaan antara regresi linier dalam analisis pembelajaran mesin reguler dan regresi linier dalam pengaturan "pembelajaran dalam". Algoritma apa yang digunakan untuk regresi linier dalam pengaturan pembelajaran yang

regression machine-learning deep-learning