Apakah ada pedoman umum tentang di mana menempatkan lapisan dropout di jaringan
Apakah ada pedoman umum tentang di mana menempatkan lapisan dropout di jaringan
Seorang anak manusia pada usia 2 membutuhkan sekitar 5 instance mobil untuk dapat mengidentifikasinya dengan akurasi yang wajar terlepas dari warna, warna, dll. Ketika anak saya berusia 2 tahun, ia dapat mengidentifikasi trem dan kereta api, meskipun ia telah melihat hanya sedikit. Karena dia...
Saya melatih jaringan saraf untuk mengklasifikasikan satu set objek menjadi n-kelas. Setiap objek dapat menjadi milik beberapa kelas sekaligus (multi-class, multi-label). Saya membaca bahwa untuk masalah multi-kelas umumnya direkomendasikan untuk menggunakan softmax dan entropi lintas kategorikal...
Saya mendapat kesan bahwa ketika orang mengacu pada jaringan 'keyakinan mendalam' bahwa ini pada dasarnya adalah jaringan saraf tetapi sangat besar. Apakah ini benar atau apakah jaringan kepercayaan yang mendalam juga menyiratkan bahwa algoritma itu sendiri berbeda (yaitu, tidak ada umpan balik...
Saya melihat bahwa banyak algoritma pembelajaran mesin bekerja lebih baik dengan pembatalan rata-rata dan penyamaan kovarian. Sebagai contoh, Neural Networks cenderung lebih cepat konvergen, dan K-Means umumnya memberikan pengelompokan yang lebih baik dengan fitur-fitur yang sudah diproses...
Saya menemukan dua pertanyaan di sini dan di sini tentang masalah ini tetapi belum ada jawaban atau penjelasan yang jelas. Saya menegakkan masalah yang sama di mana kesalahan validasi kurang dari kesalahan pelatihan di Jaringan Neural Konvolusi saya. Apa
Apa perbedaan antara umpan-maju dan jaringan saraf berulang ? Mengapa Anda menggunakan salah satunya? Apakah topologi jaringan lain ada?
Saya bertanya-tanya apakah ada perpustakaan R yang bagus di luar sana untuk mempelajari jaringan saraf yang dalam? Aku tahu ada yang nnet, neuralnetdan RSNNS, namun tidak satupun dari ini tampaknya menerapkan metode pembelajaran yang mendalam. Saya terutama tertarik pada yang tidak diawasi diikuti...
Baik PCA dan autoencoder dapat melakukan pengurangan demensi, jadi apa perbedaan di antara mereka? Dalam situasi apa saya harus menggunakan satu sama
Adakah yang bisa menjelaskan apa itu global max pooling layer dan mengapa dan kapan kita menggunakannya untuk melatih jaringan saraf. Apakah mereka memiliki keuntungan lebih dari lapisan pooling max
Saya baru di bidang pembelajaran mendalam dan bagi saya langkah pertama adalah membaca artikel menarik dari situs deeplearning.net. Dalam makalah tentang pembelajaran yang mendalam, Hinton dan yang lainnya kebanyakan berbicara tentang menerapkannya pada masalah gambar. Dapatkah seseorang mencoba...
Tampaknya mungkin untuk mendapatkan hasil yang mirip dengan jaringan saraf dengan regresi linier multivariat dalam beberapa kasus, dan regresi linier multivariat super cepat dan mudah. Dalam keadaan apa jaringan saraf dapat memberikan hasil yang lebih baik daripada regresi linier...
Dalam sebagian besar kode Tensorflow yang saya lihat Adam Optimizer digunakan dengan Laju Pembelajaran konstan 1e-4(yaitu 0,0001). Kode biasanya terlihat sebagai berikut: ...build the model... # Add the optimizer train_op = tf.train.AdamOptimizer(1e-4).minimize(cross_entropy) # Add the ops to...
Saya mengerti bagaimana sebuah artificial neural network (ANN), dapat dilatih dengan cara yang diawasi menggunakan backpropogation untuk meningkatkan pemasangan dengan mengurangi kesalahan dalam prediksi. Saya telah mendengar bahwa JST dapat digunakan untuk pembelajaran yang tidak diawasi tetapi...
Banyak penulis makalah yang saya baca menegaskan bahwa SVM adalah teknik yang unggul untuk menghadapi masalah regresi / klasifikasi mereka, menyadari bahwa mereka tidak bisa mendapatkan hasil yang sama melalui NNs. Seringkali perbandingan menyatakan itu SVM, bukannya NN, Memiliki teori pendirian...
Karena kita menggunakan fungsi logistik untuk mengubah kombinasi linear dari input menjadi output non-linear, bagaimana regresi logistik dapat dianggap sebagai classifier linier? Regresi linier sama seperti jaringan saraf tanpa lapisan tersembunyi, jadi mengapa jaringan saraf dianggap sebagai...
Saya mengerti bahwa penurunan gradien stokastik dapat digunakan untuk mengoptimalkan jaringan saraf menggunakan backpropagation dengan memperbarui setiap iterasi dengan sampel yang berbeda dari dataset pelatihan. Seberapa besar ukuran
Ada Jaringan Syaraf Berulang dan Jaringan Syaraf Rekursif. Keduanya biasanya dilambangkan dengan akronim yang sama: RNN. Menurut Wikipedia , NN Berulang sebenarnya adalah NN Rekursif, tapi saya tidak begitu mengerti penjelasannya. Selain itu, saya sepertinya tidak menemukan yang lebih baik (dengan...
Gradient Descent memiliki masalah terjebak di Minima Lokal. Kita perlu menjalankan gradient descent kali eksponensial untuk menemukan minimum global. Adakah yang bisa memberi tahu saya tentang alternatif penurunan gradien seperti yang diterapkan dalam pembelajaran jaringan saraf, bersama dengan...
Dalam posting blog baru - baru ini oleh Rong Ge, dikatakan bahwa: Dipercayai bahwa untuk banyak masalah termasuk mempelajari jaring dalam, hampir semua minimum lokal memiliki nilai fungsi yang sangat mirip dengan optimal global, dan karenanya menemukan minimum lokal cukup baik. Dari mana...