Ketika kita melakukan validasi k-fold cross, haruskah kita menggunakan classifier yang memiliki akurasi pengujian tertinggi? Apa yang umumnya pendekatan terbaik dalam mendapatkan classifier dari validasi
Ketika kita melakukan validasi k-fold cross, haruskah kita menggunakan classifier yang memiliki akurasi pengujian tertinggi? Apa yang umumnya pendekatan terbaik dalam mendapatkan classifier dari validasi
Saat menggunakan panggilan balik Penghentian Awal dalam pelatihan Keras berhenti saat beberapa metrik (biasanya kehilangan validasi) tidak meningkat. Apakah ada cara untuk menggunakan metrik lain (seperti ketepatan, penarikan, ukuran-f) alih-alih kehilangan validasi? Semua contoh yang saya lihat...
Saya menjelajahi berbagai jenis struktur pohon parse. Dua struktur pohon parse yang dikenal luas adalah a) pohon parse berbasiskan konstituensi dan b) struktur pohon parsing berdasarkan ketergantungan. Saya dapat menggunakan menghasilkan kedua jenis struktur pohon parse menggunakan paket NLP...
Baru-baru ini saya diperkenalkan ke bidang Ilmu Data (sudah sekitar 6 bulan), dan Ii memulai perjalanan dengan Kursus Pembelajaran Mesin oleh Andrew Ng dan pos yang mulai mengerjakan Spesialisasi Ilmu Data oleh JHU. Di depan aplikasi praktis, saya telah bekerja membangun model prediksi yang akan...
Saya mencoba menemukan yang setara dengan Diagram Hinton untuk jaringan multilayer untuk merencanakan bobot selama pelatihan. Jaringan terlatih agak mirip dengan Deep SRN, yaitu ia memiliki sejumlah besar matriks banyak berat yang akan membuat plot simultan dari beberapa Diagram Hinton secara...
Adakah yang bisa memberi tahu saya apa tujuan pembuatan fitur? dan mengapa pengayaan ruang fitur diperlukan sebelum mengklasifikasikan gambar? Apakah ini langkah yang perlu? Apakah ada metode untuk memperkaya ruang
Jika saya memiliki hypercube 50 dimensi. Dan saya mendefinisikan batasnya dengan atau 0,95 < x j < 1 di mana x j adalah dimensi dari hypercube. Kemudian menghitung proporsi poin pada batas hypercube akan menjadi 0,995 . Apa artinya? Apakah itu berarti bahwa sisa ruang kosong? Jika 99 % titik...
Jika menghapus beberapa neuron menghasilkan model yang berkinerja lebih baik, mengapa tidak menggunakan jaringan saraf yang lebih sederhana dengan lebih sedikit lapisan dan lebih sedikit neuron di tempat pertama? Mengapa membangun model yang lebih besar dan lebih rumit pada awalnya dan menekan...
Kalimat yang sering terdengar dalam Pembelajaran Mesin tanpa pengawasan adalah Input dimensi tinggi biasanya hidup di atau dekat manifold dimensi rendah Apa itu dimensi? Apa itu bermacam-macam? Apa bedanya? Bisakah Anda memberi contoh untuk menggambarkan keduanya? Berjenis dari...
Saya ingin tahu apakah keturunan Gradient adalah algoritma utama yang digunakan dalam pengoptimal seperti Adam, Adagrad, RMSProp dan beberapa pengoptimal lainnya.
Saya seorang pemula dalam Pembelajaran Mesin. Dalam SVM, hyperplane pemisah didefinisikan sebagai . Mengapa kita katakan vektor w ortogonal ke hyperplane yang memisahkan?y= wTx + by=wTx+by = w^T x +
Saya punya sub-pertanyaan kecil untuk pertanyaan ini . Saya mengerti bahwa ketika kembali-merambat melalui lapisan pooling max gradien dirutekan kembali dengan cara yang neuron di lapisan sebelumnya yang dipilih sebagai max mendapatkan semua gradien. Yang saya tidak yakin 100% adalah bagaimana...
Jika saya melatih model saya menggunakan kode berikut: import xgboost as xg params = {'max_depth':3, 'min_child_weight':10, 'learning_rate':0.3, 'subsample':0.5, 'colsample_bytree':0.6, 'obj':'reg:linear', 'n_estimators':1000, 'eta':0.3} features = df[feature_columns] target =
Hai punya dataframe dengan nilai kategori besar lebih dari 1600 kategori apakah ada cara saya bisa menemukan alternatif sehingga saya tidak memiliki lebih dari 1.600 kolom. Saya menemukan ini di bawah ini tautan menarik http://amunategui.github.io/feature-hashing/#sourcecode Tetapi mereka...
Saya seorang pemula dalam pembelajaran mesin dan saya menghadapi situasi. Saya sedang mengerjakan masalah Penawaran Waktu Nyata, dengan dataset IPinYou dan saya mencoba melakukan prediksi klik. Masalahnya adalah, seperti yang Anda ketahui, dataset sangat tidak seimbang: Sekitar 1.300 contoh...
Apakah ada metode untuk menghitung interval prediksi (distribusi probabilitas) di sekitar perkiraan deret waktu dari jaringan saraf LSTM (atau berulang lainnya)? Katakanlah, misalnya, saya memprediksi 10 sampel ke masa depan (t + 1 hingga t + 10), berdasarkan pada 10 sampel terakhir yang diamati...
Saat ini saya mencoba memahami arsitektur CNN. Saya mengerti konvolusi, layer ReLU, pooling layer, dan layer yang sepenuhnya terhubung. Namun, saya masih bingung dengan bobotnya. Dalam jaringan saraf normal, masing-masing neuron memiliki beratnya sendiri. Pada lapisan yang terhubung penuh,...
Saya ingin memprediksi beberapa nilai dan saya mencoba untuk mendapatkan beberapa prediksi yang mengoptimalkan antara serendah mungkin, tetapi masih lebih besar dariY(x)Y(x)Y(x)Y^(x)Y^(x)\hat
Saya mencari bobot pra-terlatih dari model yang sudah dilatih seperti data Google News dll. Saya merasa sulit untuk melatih model baru dengan jumlah data (10 GB dll) yang cukup untuk saya sendiri. Jadi, saya ingin mengambil manfaat dari pembelajaran transfer di mana saya akan bisa mendapatkan bobot...
Saya membaca presentasi dan merekomendasikan untuk tidak menggunakan menyisakan satu penyandian, tetapi tidak masalah dengan satu penyandian panas. Saya pikir mereka berdua sama. Adakah yang bisa menggambarkan perbedaan di antara