Mengapa berbahaya untuk menginisialisasi bobot dengan nol? Apakah ada contoh sederhana yang
Mengapa berbahaya untuk menginisialisasi bobot dengan nol? Apakah ada contoh sederhana yang
Saya membaca makalah Klasifikasi ImageNet dengan Jaringan Neural Konvolusional Dalam dan pada bagian 3 mereka menjelaskan arsitektur Jaringan Neural Konvolusional mereka, mereka menjelaskan bagaimana mereka lebih suka menggunakan: non-jenuh nonlinierf( x ) = m a x ( 0 , x )
Apa perbedaan antara jaringan saraf , jaringan Bayesian , pohon keputusan dan jaring Petri , meskipun semuanya adalah model grafis dan menggambarkan secara visual hubungan
Tutup. Pertanyaan ini di luar topik . Saat ini tidak menerima jawaban. Ingin meningkatkan pertanyaan ini? Perbarui pertanyaan sehingga sesuai topik untuk Cross Validated. Ditutup 2 tahun yang lalu . Saya menggunakan tanda sisipan untuk menjalankan hutan...
Mengapa node bias digunakan dalam jaringan saraf? Berapa banyak yang harus Anda gunakan? Di lapisan mana Anda harus menggunakannya: semua lapisan tersembunyi dan lapisan
Saya akan menjelaskan masalah saya dengan sebuah contoh. Misalkan Anda ingin memprediksi penghasilan seseorang yang diberikan beberapa atribut: {Usia, Jenis Kelamin, Negara, Wilayah, Kota}. Anda memiliki dataset pelatihan seperti itu train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3),...
Saya melatih jaringan saraf sederhana pada dataset CIFAR10. Setelah beberapa waktu, kehilangan validasi mulai meningkat, sedangkan akurasi validasi juga meningkat. Kehilangan pengujian dan akurasi pengujian terus meningkat. Bagaimana ini mungkin? Tampaknya jika kehilangan validasi meningkat,...
Saya bingung. Apakah ada perbedaan antara jaringan kepercayaan Deep dan Deep Boltzmann Machines? Jika demikian, apa
Katakanlah kita ingin melakukan regresi untuk f = x * ymenggunakan jaringan saraf standar yang sederhana . Saya ingat bahwa ada beberapa penelitian yang mengatakan bahwa NN dengan satu layer tersembunyi dapat menggunakan fungsi apa pun, tetapi saya telah mencoba dan tanpa normalisasi, NN tidak...
Untuk model statistik dan pembelajaran mesin, ada beberapa tingkat interpretabilitas: 1) algoritma secara keseluruhan, 2) bagian dari algoritma secara umum 3) bagian dari algoritma pada input tertentu, dan tiga level ini dibagi menjadi dua bagian masing-masing, satu untuk pelatihan dan satu untuk...
Saat melatih jaringan saraf segmentasi piksel, seperti jaringan konvolusional penuh, bagaimana Anda membuat keputusan untuk menggunakan fungsi kehilangan lintas-entropi versus fungsi kerugian koefisien-dadu? Saya menyadari ini adalah pertanyaan singkat, tetapi tidak yakin informasi apa yang...
Asumsikan saya ingin melakukan klasifikasi biner (sesuatu milik kelas A atau kelas B). Ada beberapa kemungkinan untuk melakukan ini di lapisan output dari jaringan saraf: Gunakan 1 simpul output. Output 0 (<0,5) dianggap kelas A dan 1 (> = 0,5) dianggap kelas B (dalam kasus sigmoid) Gunakan...
Saya baca di sini sebagai berikut: Output Sigmoid tidak berpusat nol . Ini tidak diinginkan karena neuron dalam lapisan pemrosesan berikutnya dalam Jaringan Saraf Tiruan (lebih lanjut tentang ini segera) akan menerima data yang tidak berpusat nol. Ini memiliki implikasi pada dinamika selama...
Saya tertarik pada regresi dengan jaringan saraf. Jaringan saraf dengan nol simpul tersembunyi + koneksi skip-layer adalah model linier. Bagaimana dengan jaring saraf yang sama tetapi dengan simpul tersembunyi? Saya bertanya-tanya apa yang akan menjadi peran koneksi skip-layer? Secara intuitif,...
Kehilangan latihan saya turun dan naik lagi. Sangat aneh. Kehilangan validasi silang melacak kehilangan pelatihan. Apa yang sedang terjadi? Saya memiliki dua LSTMS yang ditumpuk sebagai berikut (pada Keras): model = Sequential() model.add(LSTM(512, return_sequences=True, input_shape=(len(X[0]),...
Apa keuntungannya, mengapa seseorang menggunakan banyak LSTM, ditumpuk satu demi satu, dalam jaringan yang dalam? Saya menggunakan LSTM untuk mewakili urutan input sebagai input tunggal. Jadi, begitu saya memiliki representasi tunggal itu — mengapa saya harus melewatinya lagi? Saya bertanya ini...
Ditutup . Pertanyaan ini didasarkan pada pendapat . Saat ini tidak menerima jawaban. Ingin meningkatkan pertanyaan ini? Perbarui pertanyaan sehingga dapat dijawab dengan fakta dan kutipan dengan mengedit posting ini . Ditutup 2 tahun yang lalu . Masalah...
Pertanyaan ini dimigrasikan dari Stack Overflow karena dapat dijawab pada Cross Validated. Bermigrasi 7 tahun yang lalu . Saya mencoba mempelajari bagaimana Neural Network bekerja pada pengenalan gambar. Saya telah melihat beberapa contoh dan menjadi semakin bingung.
Mengapa fungsi aktivasi unit linear yang diperbaiki (ReLU) dianggap non-linear? f( x ) = maks ( 0 , x )f(x)=max(0,x) f(x) = \max(0,x) Mereka linier ketika input positif dan dari pemahaman saya untuk membuka kekuatan representatif dari jaringan yang dalam, aktivasi non-linear adalah suatu...
Saya bertanya-tanya, mengapa begitu penting memiliki pembelajaran mesin berprinsip / teoretis? Dari sudut pandang pribadi sebagai manusia, saya bisa mengerti mengapa Machine Learning berprinsip akan menjadi penting: manusia suka memahami apa yang mereka lakukan, kami menemukan keindahan dan...