Pertanyaan yang diberi tag networks

9

Seberapa efisienkah Q-learning dengan Neural Networks ketika ada satu unit output per tindakan?

Latar belakang: Saya menggunakan pendekatan Q-value Neural Network dalam tugas pembelajaran penguatan saya. Pendekatannya persis sama dengan yang dijelaskan dalam pertanyaan ini , namun pertanyaannya sendiri berbeda. Dalam pendekatan ini jumlah output adalah jumlah tindakan yang bisa kita ambil....

9

Apakah penghentian dan putus sekolah dini cukup untuk meregulasi sebagian besar jaringan saraf yang dalam dalam praktik?

Ada begitu banyak teknik regularisasi, tidak praktis untuk mencoba semua kombinasi: l1 / l2 norma maks keluar berhenti lebih awal ... Tampaknya sebagian besar orang senang dengan kombinasi putus sekolah + berhenti dini: apakah ada kasus di mana menggunakan teknik lain masuk akal? Misalnya,...

neural-networks regularization dropout

9

Bagaimana generator di GAN dilatih?

The kertas pada Gans mengatakan diskriminator menggunakan gradien berikut untuk kereta: ∇θd1m∑i = 1m[ logD (x( i )) +log( 1 - D ( G (z( i )) ) ) ]∇θd1m∑saya=1m[catatan⁡D(x(saya))+catatan⁡(1-D(G(z(saya))))]\nabla _{\theta_d} \frac{1}{m}\sum^{m}_{i=1} [\log{D(x^{(i)})} +...

machine-learning neural-networks

9

Bagaimana cara menerapkan Softmax sebagai fungsi Aktivasi dalam multi-layer Perceptron di scikit-learn? [Tutup]

Tutup. Pertanyaan ini di luar topik . Saat ini tidak menerima jawaban. Ingin meningkatkan pertanyaan ini? Perbarui pertanyaan sehingga sesuai topik untuk Cross Validated. Ditutup 11 bulan lalu . Saya perlu menerapkan fungsi aktivasi Softmax ke

neural-networks scikit-learn multi-class softmax

9

Pemilihan fitur menggunakan pembelajaran mendalam?

Saya ingin menghitung pentingnya setiap fitur input menggunakan model yang mendalam. Tetapi saya hanya menemukan satu makalah tentang pemilihan fitur menggunakan pembelajaran mendalam - pemilihan fitur dalam . Mereka menyisipkan lapisan node yang terhubung ke setiap fitur secara langsung, sebelum...

feature-selection deep-learning deep-belief-networks rbm

9

Gradien untuk skipgram word2vec

Saya akan membahas masalah-masalah dalam tugas penugasan tertulis kelas pembelajaran mendalam di Stanford NLP http://cs224d.stanford.edu/assignment1/assignment1_soln Saya mencoba memahami jawaban untuk 3a di mana mereka mencari turunan ke vektor untuk kata pusat. Asumsikan Anda diberikan vektor...

self-study neural-networks backpropagation word2vec

9

Memahami topologi LSTM

Seperti banyak orang lain, saya menemukan sumber daya di sini dan di sini sangat berguna untuk memahami sel-sel LSTM. Saya yakin saya mengerti bagaimana nilai mengalir dan diperbarui, dan saya cukup percaya diri untuk menambahkan "koneksi lubang intip" yang disebutkan, dll. Dalam contoh saya, saya...

machine-learning neural-networks lstm rnn

9

Data pelatihan tidak seimbang - tetapi apakah set validasi saya juga harus?

Saya telah memberi label data yang terdiri dari 10.000 contoh positif, dan 50.000 contoh negatif, sehingga totalnya 60000 contoh. Jelas data ini tidak seimbang. Sekarang katakanlah saya ingin membuat set validasi saya, dan saya ingin menggunakan 10% dari data saya untuk melakukannya. Pertanyaan...

machine-learning neural-networks cross-validation dataset unbalanced-classes

9

Pelatihan jaringan saraf untuk regresi selalu memprediksi rata-rata

Saya melatih jaringan saraf convolutional sederhana untuk regresi, di mana tugasnya adalah untuk memprediksi lokasi (x, y) kotak dalam gambar, misalnya: Output dari jaringan memiliki dua node, satu untuk x, dan satu untuk y. Sisa dari jaringan adalah jaringan saraf convolutional standar....

machine-learning neural-networks optimization deep-learning loss-functions

9

Bagaimana cara menafsirkan kurva survival model bahaya Cox?

Bagaimana Anda menginterpretasikan kurva survival dari model hazard proporsional cox? Dalam contoh mainan ini, anggaplah kita memiliki model hazard proporsional cox pada agevariabel dalam kidneydata, dan menghasilkan kurva survival. library(survival) fit <- coxph(Surv(time, status)~age,...

r survival cox-model likelihood machine-learning deep-learning generative-models machine-learning reinforcement-learning q-learning regression multicollinearity convergence beta-distribution bernoulli-distribution machine-learning self-study pattern-recognition neural-networks stochastic-processes linear

9

Model pembelajaran dalam mana yang dapat mengklasifikasikan kategori yang tidak eksklusif satu sama lain

Contoh: Saya memiliki kalimat dalam deskripsi pekerjaan: "Java senior engineer in UK". Saya ingin menggunakan model pembelajaran yang mendalam untuk memperkirakannya sebagai 2 kategori: English dan IT jobs. Jika saya menggunakan model klasifikasi tradisional, hanya dapat memprediksi 1 label dengan...

machine-learning deep-learning natural-language tensorflow sampling distance non-independent application regression machine-learning logistic mixed-model control-group crossover r multivariate-analysis ecology procrustes-analysis vegan regression hypothesis-testing interpretation chi-squared bootstrap r bioinformatics bayesian exponential beta-distribution bernoulli-distribution conjugate-prior distributions bayesian prior beta-distribution covariance naive-bayes smoothing laplace-smoothing distributions data-visualization regression probit penalized estimation unbiased-estimator fisher-information unbalanced-classes bayesian model-selection aic multiple-regression cross-validation regression-coefficients nonlinear-regression standardization naive-bayes trend machine-learning clustering unsupervised-learning wilcoxon-mann-whitney z-score econometrics generalized-moments method-of-moments machine-learning conv-neural-network image-processing ocr machine-learning neural-networks conv-neural-network tensorflow r logistic scoring-rules probability self-study pdf cdf classification svm resampling forecasting rms volatility-forecasting diebold-mariano neural-networks prediction-interval uncertainty

9

Diferensiasi Lintas Entropi

Saya telah mencoba membuat program untuk melatih Neural Networks di komputer saya. Untuk Jaringan yang dimaksud, saya telah memutuskan untuk menggunakan fungsi Cross Entropy Error: E=−∑jtjlnojE=−∑jtjln⁡ojE = -\sum_jt_j\ln o_j Di mana adalah output target untuk Neuron , dan adalah output dari...

machine-learning neural-networks derivative cross-entropy differential-equations

9

Apa prediksi padat dalam pembelajaran mendalam?

Saya menggunakan model TensorFlow yang telah dilatih sebelumnya dari Jaringan Neural Konvolusional. https://github.com/tensorflow/models/blob/master/slim/nets/resnet_v2.py#L130 Saya menemukan kalimat berikut: Namun, untuk tugas prediksi yang padat kami menyarankan agar seseorang menggunakan...

neural-networks conv-neural-network

9

Log probabilitas yang mengacu pada classifier softmax

Dalam https://cs231n.github.io/neural-networks-case-study/ ini mengapa disebutkan "Softmax classifier menafsirkan setiap elemen ff sebagai memegang probabilitas log (tidak normal) dari tiga kelas." Saya mengerti mengapa itu tidak dinormalkan tetapi tidak mengapa itu log? Apa arti probabilitas...

machine-learning neural-networks information-theory softmax

9

Di mana menemukan model pra-terlatih untuk pembelajaran transfer [tertutup]

Ditutup . Pertanyaan ini perlu lebih fokus . Saat ini tidak menerima jawaban. Ingin meningkatkan pertanyaan ini? Perbarui pertanyaan sehingga berfokus pada satu masalah hanya dengan mengedit posting ini . Ditutup 2 tahun yang lalu . Saya baru di...

machine-learning classification neural-networks transfer-learning

9

Berapa banyak parameter yang ada di dalam layer grating recurrent unit (GRU) recurrent neural network (RNN)?

Judul mengatakan semuanya - berapa banyak parameter yang bisa dilatih yang ada di lapisan GRU? Pertanyaan semacam ini banyak muncul ketika mencoba membandingkan model dari tipe lapisan RNN yang berbeda, seperti unit memori jangka pendek (LSTM) vs GRU, dalam hal kinerja per-parameter. Karena...

neural-networks rnn gru

9

Autoencoder variabel dengan model campuran Gaussian

Sebuah autoencoder variational (Vae) menyediakan cara belajar distribusi probabilitas yang berkaitan masukan representasi latennya . Secara khusus, encoder memetakan input ke distribusi pada . Encoder tipikal akan menampilkan parameter , mewakili distribusi Gaussian ; distribusi ini digunakan...

neural-networks deep-learning autoencoders variational-bayes

9

Jaringan saraf saya bahkan tidak bisa belajar jarak Euclidean

Jadi saya mencoba untuk belajar sendiri jaringan saraf (untuk aplikasi regresi, bukan mengklasifikasikan gambar kucing). Eksperimen pertama saya adalah melatih jaringan untuk mengimplementasikan filter FIR dan Discrete Fourier Transform (pelatihan pada sinyal "sebelum" dan "setelah"), karena...

machine-learning neural-networks optimization keras euclidean

9

Apakah fungsi

Apakah fungsi dalam bentuk memiliki nama standar? Misalnya adalah fungsi linier.ex/(1+ex)ex/(1+ex)e^x/(1+e^x)y=a+bxy=a+bxy = a +

logistic neural-networks deep-learning terminology

9

Mengapa informasi tentang data validasi bocor jika saya mengevaluasi kinerja model pada data validasi ketika menyetel hyperparameters?

Dalam Pembelajaran Dalam François Chollet dengan Python dikatakan: Akibatnya, menyetel konfigurasi model berdasarkan kinerjanya pada set validasi dapat dengan cepat menghasilkan overfitting ke set validasi, meskipun model Anda tidak pernah dilatih secara langsung mengenai hal itu. Inti dari...

neural-networks cross-validation hyperparameter