Pertanyaan yang diberi tag machine-learning

13

Bagaimana memilih classifier setelah cross-validation?

Ketika kita melakukan validasi k-fold cross, haruskah kita menggunakan classifier yang memiliki akurasi pengujian tertinggi? Apa yang umumnya pendekatan terbaik dalam mendapatkan classifier dari validasi

machine-learning cross-validation

13

Apakah ada cara lain untuk mengubah metrik yang digunakan oleh panggilan balik Penghentian Awal di Keras?

Saat menggunakan panggilan balik Penghentian Awal dalam pelatihan Keras berhenti saat beberapa metrik (biasanya kehilangan validasi) tidak meningkat. Apakah ada cara untuk menggunakan metrik lain (seperti ketepatan, penarikan, ukuran-f) alih-alih kehilangan validasi? Semua contoh yang saya lihat...

machine-learning neural-network deep-learning keras

13

Fitur apa yang biasanya digunakan dari pohon Parse dalam proses klasifikasi di NLP?

Saya menjelajahi berbagai jenis struktur pohon parse. Dua struktur pohon parse yang dikenal luas adalah a) pohon parse berbasiskan konstituensi dan b) struktur pohon parsing berdasarkan ketergantungan. Saya dapat menggunakan menghasilkan kedua jenis struktur pohon parse menggunakan paket NLP...

machine-learning nlp feature-selection feature-extraction

13

Mempelajari algoritma pembelajaran mesin: kedalaman pemahaman vs jumlah algoritma

Baru-baru ini saya diperkenalkan ke bidang Ilmu Data (sudah sekitar 6 bulan), dan Ii memulai perjalanan dengan Kursus Pembelajaran Mesin oleh Andrew Ng dan pos yang mulai mengerjakan Spesialisasi Ilmu Data oleh JHU. Di depan aplikasi praktis, saya telah bekerja membangun model prediksi yang akan...

machine-learning

13

Memvisualisasikan pelatihan jaringan saraf yang mendalam

Saya mencoba menemukan yang setara dengan Diagram Hinton untuk jaringan multilayer untuk merencanakan bobot selama pelatihan. Jaringan terlatih agak mirip dengan Deep SRN, yaitu ia memiliki sejumlah besar matriks banyak berat yang akan membuat plot simultan dari beberapa Diagram Hinton secara...

machine-learning neural-network visualization deep-learning

13

Apa perbedaan antara pembuatan fitur dan ekstraksi fitur?

Adakah yang bisa memberi tahu saya apa tujuan pembuatan fitur? dan mengapa pengayaan ruang fitur diperlukan sebelum mengklasifikasikan gambar? Apakah ini langkah yang perlu? Apakah ada metode untuk memperkaya ruang

machine-learning classification

13

Apa artinya ketika kita mengatakan sebagian besar poin dalam hypercube berada di perbatasan?

Jika saya memiliki hypercube 50 dimensi. Dan saya mendefinisikan batasnya dengan atau 0,95 < x j < 1 di mana x j adalah dimensi dari hypercube. Kemudian menghitung proporsi poin pada batas hypercube akan menjadi 0,995 . Apa artinya? Apakah itu berarti bahwa sisa ruang kosong? Jika 99 % titik...

machine-learning math

13

Mengapa menambahkan dropout layer meningkatkan kinerja pembelajaran mesin / dalam, mengingat bahwa dropout menekan beberapa neuron dari model?

Jika menghapus beberapa neuron menghasilkan model yang berkinerja lebih baik, mengapa tidak menggunakan jaringan saraf yang lebih sederhana dengan lebih sedikit lapisan dan lebih sedikit neuron di tempat pertama? Mengapa membangun model yang lebih besar dan lebih rumit pada awalnya dan menekan...

machine-learning deep-learning keras regularization dropout

13

Dimensi dan Beragam

Kalimat yang sering terdengar dalam Pembelajaran Mesin tanpa pengawasan adalah Input dimensi tinggi biasanya hidup di atau dekat manifold dimensi rendah Apa itu dimensi? Apa itu bermacam-macam? Apa bedanya? Bisakah Anda memberi contoh untuk menggambarkan keduanya? Berjenis dari...

machine-learning dimensionality-reduction

13

Apakah Gradient Descent penting bagi setiap pengoptimal?

Saya ingin tahu apakah keturunan Gradient adalah algoritma utama yang digunakan dalam pengoptimal seperti Adam, Adagrad, RMSProp dan beberapa pengoptimal lainnya.

machine-learning neural-network deep-learning optimization gradient-descent

13

Dalam Algoritma SVM, mengapa vektor w ortogonal dengan hyperplane pemisah?

Saya seorang pemula dalam Pembelajaran Mesin. Dalam SVM, hyperplane pemisah didefinisikan sebagai . Mengapa kita katakan vektor w ortogonal ke hyperplane yang memisahkan?y= wTx + by=wTx+by = w^T x +

machine-learning svm

13

Kembali-propagasi melalui lapisan penyatuan maks

Saya punya sub-pertanyaan kecil untuk pertanyaan ini . Saya mengerti bahwa ketika kembali-merambat melalui lapisan pooling max gradien dirutekan kembali dengan cara yang neuron di lapisan sebelumnya yang dipilih sebagai max mendapatkan semua gradien. Yang saya tidak yakin 100% adalah bagaimana...

machine-learning neural-network convnet backpropagation

13

XGBRegressor vs xgboost.train perbedaan kecepatan yang sangat besar?

Jika saya melatih model saya menggunakan kode berikut: import xgboost as xg params = {'max_depth':3, 'min_child_weight':10, 'learning_rate':0.3, 'subsample':0.5, 'colsample_bytree':0.6, 'obj':'reg:linear', 'n_estimators':1000, 'eta':0.3} features = df[feature_columns] target =

machine-learning python decision-trees xgboost efficiency

13

Satu alternatif penyandian panas untuk nilai kategori besar?

Hai punya dataframe dengan nilai kategori besar lebih dari 1600 kategori apakah ada cara saya bisa menemukan alternatif sehingga saya tidak memiliki lebih dari 1.600 kolom. Saya menemukan ini di bawah ini tautan menarik http://amunategui.github.io/feature-hashing/#sourcecode Tetapi mereka...

machine-learning dataset dimensionality-reduction encoding

13

Dengan kelas yang tidak seimbang, apakah saya harus menggunakan pengambilan sampel pada validasi / pengujian dataset saya?

Saya seorang pemula dalam pembelajaran mesin dan saya menghadapi situasi. Saya sedang mengerjakan masalah Penawaran Waktu Nyata, dengan dataset IPinYou dan saya mencoba melakukan prediksi klik. Masalahnya adalah, seperti yang Anda ketahui, dataset sangat tidak seimbang: Sekitar 1.300 contoh...

machine-learning dataset sampling

13

Interval prediksi sekitar perkiraan seri waktu LSTM

Apakah ada metode untuk menghitung interval prediksi (distribusi probabilitas) di sekitar perkiraan deret waktu dari jaringan saraf LSTM (atau berulang lainnya)? Katakanlah, misalnya, saya memprediksi 10 sampel ke masa depan (t + 1 hingga t + 10), berdasarkan pada 10 sampel terakhir yang diamati...

machine-learning deep-learning time-series prediction lstm

13

Memperbarui bobot filter dalam CNN

Saat ini saya mencoba memahami arsitektur CNN. Saya mengerti konvolusi, layer ReLU, pooling layer, dan layer yang sepenuhnya terhubung. Namun, saya masih bingung dengan bobotnya. Dalam jaringan saraf normal, masing-masing neuron memiliki beratnya sendiri. Pada lapisan yang terhubung penuh,...

machine-learning neural-network deep-learning image-classification cnn

13

Regresi linier dengan fungsi biaya non-simetris?

Saya ingin memprediksi beberapa nilai dan saya mencoba untuk mendapatkan beberapa prediksi yang mengoptimalkan antara serendah mungkin, tetapi masih lebih besar dariY(x)Y(x)Y(x)Y^(x)Y^(x)\hat

machine-learning logistic-regression

13

Bisakah kita mengambil manfaat dari menggunakan pembelajaran transfer sambil melatih model word2vec?

Saya mencari bobot pra-terlatih dari model yang sudah dilatih seperti data Google News dll. Saya merasa sulit untuk melatih model baru dengan jumlah data (10 GB dll) yang cukup untuk saya sendiri. Jadi, saya ingin mengambil manfaat dari pembelajaran transfer di mana saya akan bisa mendapatkan bobot...

machine-learning bigdata word2vec

13

Apa perbedaan antara satu pengkodean panas dan meninggalkan satu pengkodean keluar?

Saya membaca presentasi dan merekomendasikan untuk tidak menggunakan menyisakan satu penyandian, tetapi tidak masalah dengan satu penyandian panas. Saya pikir mereka berdua sama. Adakah yang bisa menggambarkan perbedaan di antara

machine-learning data-mining feature-selection feature-extraction feature-engineering