Dalam Pendahuluan saya baru saja berubah loss = tf.reduce_mean(tf.square(y - y_data)) untuk loss = tf.reduce_mean(tf.abs(y - y_data)) dan model tidak dapat mempelajari kerugian hanya menjadi lebih besar seiring waktu.
Dalam Pendahuluan saya baru saja berubah loss = tf.reduce_mean(tf.square(y - y_data)) untuk loss = tf.reduce_mean(tf.abs(y - y_data)) dan model tidak dapat mempelajari kerugian hanya menjadi lebih besar seiring waktu.
Ada beberapa pendekatan pemilihan fitur / pemilihan variabel (lihat misalnya Guyon & Elisseeff, 2003 ; Liu et al., 2010 ): metode filter (misalnya, berbasis korelasi, berbasis entropi, berbasis kepentingan hutan acak), metode pembungkus (misalnya, pencarian maju, pencarian mendaki bukit), dan...
Dropout ( kertas , penjelasan ) mengatur output dari beberapa neuron ke nol. Jadi untuk MLP, Anda bisa memiliki arsitektur berikut untuk dataset bunga Iris : 4 : 50 (tanh) : dropout (0.5) : 20 (tanh) : 3 (softmax) Ini akan bekerja seperti ini: s o ft m a x ( W3⋅ tanh( W2⋅ topeng ( D , tanh( W1⋅...
Apakah ada cara untuk menjaga variabel (tabel besar / bingkai data) dalam memori dan membaginya di beberapa notebook ipython? Saya akan mencari sesuatu, yang secara konseptual mirip dengan variabel gigih MATLAB. Ada kemungkinan untuk memanggil fungsi kustom / pustaka dari beberapa editor individu...
Saya bertanya-tanya bagaimana menafsirkan arsitektur berulang dalam konteks EEG. Secara khusus saya memikirkan ini sebagai CNN Berulang (yang bertentangan dengan arsitektur seperti LSTM), tapi mungkin itu berlaku untuk jenis jaringan berulang lainnya juga Ketika saya membaca tentang R-CNN, mereka...
Saya ingin dapat memperkirakan apakah model yang diusulkan cukup kecil untuk dilatih pada GPU dengan jumlah memori tertentu Jika saya memiliki arsitektur CNN sederhana seperti ini: Input: 50x50x3 C1: 32 3x3 kernel, dengan padding (saya kira pada kenyataannya theyre sebenarnya 3x3x3 diberikan...
Dari tutorial XGBoost, saya pikir ketika setiap pohon tumbuh, semua variabel dipindai untuk dipilih untuk membagi node, dan yang dengan pembagian gain maksimum akan dipilih. Jadi pertanyaan saya adalah bagaimana jika saya menambahkan beberapa variabel derau ke dalam kumpulan data, akankah variabel...
Saya mengerti bagaimana GAN bekerja sementara dua jaringan (generatif dan diskriminatif) saling bersaing. Saya telah membangun DCGAN (GAN dengan diskriminator convolutional dan generator de-convolutional) yang sekarang berhasil menghasilkan digit tulisan tangan yang mirip dengan yang ada dalam...
Latar Belakang: Ketika menyesuaikan jaringan saraf dengan aktivasi relu, saya menemukan bahwa kadang-kadang prediksi menjadi hampir konstan. Saya percaya bahwa ini adalah karena neuron relu mati selama pelatihan seperti yang dinyatakan di sini. ( Apa masalah "ReLU sekarat" dalam jaringan saraf?...
Mari kita asumsikan bahwa kita menggunakan ukuran batch 100 sampel untuk belajar. Jadi dalam setiap batch, berat setiap neuron (dan bias, dll) sedang diperbarui dengan menambahkan minus dari tingkat pembelajaran * nilai kesalahan rata-rata yang kami temukan menggunakan 100 sampel * turunan dari...
Pertanyaan saya adalah ini: Apakah ada perbedaan antara pembelajaran mesin dan kecerdasan buatan? Atau apakah istilah-istilah ini merujuk pada hal yang
Saya sedang mengerjakan aplikasi untuk membantu orang belajar bahasa Inggris sebagai bahasa kedua. Saya telah membuktikan bahwa kalimat membantu dalam belajar bahasa dengan memberikan konteks tambahan. Saya melakukan itu dengan melakukan penelitian kecil di ruang kelas yang terdiri dari 60...
Saya seorang pemula dalam jaringan saraf dan saat ini saya sedang mengeksplorasi model word2vec. Namun saya mengalami kesulitan untuk memahami apa sebenarnya fitur matriks. Saya bisa mengerti bahwa matriks pertama adalah vektor pengodean satu-panas untuk kata tertentu, tetapi apa yang ditandakan...
Saya sudah membaca penjelasan konvolusi dan memahaminya sampai batas tertentu. Adakah yang bisa membantu saya memahami bagaimana operasi ini berhubungan dengan konvolusi dalam Jaring Saraf Konvolusional? Apakah fungsi seperti filter gyang menerapkan
Normalisasi Batch dijelaskan dalam makalah ini sebagai normalisasi input ke fungsi aktivasi dengan skala dan variabel bergeserγγ\gamma dan ββ\beta. Makalah ini terutama menjelaskan menggunakan fungsi aktivasi sigmoid, yang masuk akal. Namun, bagi saya tampaknya memberi makan input dari distribusi...
Saya sedang dalam proses mempersiapkan untuk mengajar kursus pengantar tentang ilmu data menggunakan bahasa pemrograman R. Audiens saya adalah mahasiswa sarjana jurusan mata pelajaran bisnis. Sarjana bisnis yang khas tidak memiliki pengalaman pemrograman komputer, tetapi telah mengambil beberapa...
Saya ingin menggunakan JST untuk masalah saya, tetapi masalahnya adalah input dan output saya nomor node tidak diperbaiki. Saya melakukan pencarian google sebelum mengajukan pertanyaan saya dan menemukan bahwa RNN dapat membantu saya dengan masalah saya. Tapi, semua contoh yang saya temukan entah...
Saya memiliki dataset seperti ini: Contoh Dataframe import pandas as pd df = pd.DataFrame({ 'names': ['A','B','C','D','E','F','G','H','I','J','K','L'], 'col1': [0, 1, 0, 1, 1, 1, 0, 0, 0, 1, 0, 0], 'col2': [0, 0, 0, 0, 1, 0, 1, 0, 1, 0, 0, 0]}) Saya ingin mengganti beberapa 0's di col1dan...
Saya memiliki dataset dengan 330 sampel dan 27 fitur untuk setiap sampel, dengan masalah kelas biner untuk Regresi Logistik. Menurut "aturan jika sepuluh" saya membutuhkan setidaknya 10 peristiwa untuk setiap fitur untuk dimasukkan. Padahal, saya memiliki dataset yang tidak seimbang, dengan 20%...
Saya sekarang membaca buku berjudul "Pembelajaran Mesin Langsung dengan Scikit-Learn dan TensorFlow" dan pada bab 11, ia memiliki deskripsi berikut tentang penjelasan ELU (Exponential ReLU). Ketiga, fungsinya halus di mana-mana, termasuk di sekitar z = 0, yang membantu mempercepat Gradient...