Apa perbedaan antara Gradient Descent dan Stochastic Gradient Descent? Saya tidak terlalu terbiasa dengan ini, dapatkah Anda menggambarkan perbedaannya dengan contoh
Apa perbedaan antara Gradient Descent dan Stochastic Gradient Descent? Saya tidak terlalu terbiasa dengan ini, dapatkah Anda menggambarkan perbedaannya dengan contoh
Saat ini saya sedang bekerja dengan Python dan Scikit belajar untuk keperluan klasifikasi, dan melakukan beberapa pembacaan di sekitar GridSearch. Saya pikir ini adalah cara yang bagus untuk mengoptimalkan parameter estimator saya untuk mendapatkan hasil terbaik. Metodologi saya adalah ini: Bagi...
Ada banyak teknik untuk memvisualisasikan kumpulan data berdimensi tinggi, seperti T-SNE, isomap, PCA, PCA yang diawasi, dll. Dan kami melalui gerakan memproyeksikan data ke ruang 2D atau 3D, jadi kami memiliki "gambar-gambar cantik" ". Beberapa metode penanaman (manifold learning) ini dijelaskan...
Apakah lebih baik untuk menyandikan fitur seperti bulan dan jam sebagai faktor atau angka dalam model pembelajaran mesin? Di satu sisi, saya merasa pengkodean numerik mungkin masuk akal, karena waktu adalah proses maju maju (bulan kelima diikuti oleh bulan keenam), tetapi di sisi lain saya pikir...
Ditutup . Pertanyaan ini didasarkan pada pendapat . Saat ini tidak menerima jawaban. Ingin meningkatkan pertanyaan ini? Perbarui pertanyaan sehingga dapat dijawab dengan fakta dan kutipan dengan mengedit posting ini . Ditutup 5 tahun yang lalu . Saya...
Saya mencari makalah yang merinci dasar-dasar pembelajaran yang mendalam. Idealnya seperti kursus Andrew Ng untuk pembelajaran mendalam. Apakah Anda tahu di mana saya dapat menemukan
Saya sedang membaca tentang solusi untuk tantangan OTTO Kaggle ini dan solusi tempat pertama tampaknya menggunakan beberapa transformasi untuk input data X, misalnya Log (X + 1), sqrt (X + 3/8), dll. Apakah ada pedoman umum tentang kapan menerapkan transformasi jenis apa ke berbagai...
Saya sering mendengar orang mengatakan bahwa mengapa jaringan saraf convolutional masih kurang dipahami. Apakah diketahui mengapa jaringan saraf convolutional selalu berakhir dengan belajar fitur yang semakin canggih saat kita naik lapisan? Apa yang menyebabkan mereka membuat setumpuk fitur dan...
Bagaimana cara menghitung peta (rata-rata Presisi Rata-Rata) untuk tugas deteksi untuk papan peringkat Pascal VOC? http://host.robots.ox.ac.uk:8080/leaderboard/displaylb.php?challengeid=11&compid=4 Di sana dikatakan - di halaman 11 :
Saya membaca dokumentasi resmi scikit-belajar belajar setelah membaca buku tentang ML dan menemukan hal-hal berikut: Dalam Dokumentasi itu diberikan tentang sklearn.preprocessing.OrdinalEncoder()sedangkan dalam buku itu diberikan tentang sklearn.preprocessing.LabelEncoder(), ketika saya memeriksa...
Baru-baru ini seorang teman saya ditanya apakah algoritma pohon keputusan adalah algoritma linear atau nonlinier dalam sebuah wawancara. Saya mencoba mencari jawaban untuk pertanyaan ini tetapi tidak dapat menemukan penjelasan yang memuaskan. Adakah yang bisa menjawab dan menjelaskan solusi untuk...
Saya bertanya-tanya apakah ada skenario di mana gradient descent tidak menyatu ke minimum. Saya sadar bahwa gradient descent tidak selalu dijamin akan menyatu dengan global optimal. Saya juga sadar bahwa itu mungkin berbeda dari optimal jika, katakanlah, ukuran langkah terlalu besar. Namun, bagi...
Saya ingin menghitung ketepatan, daya ingat dan skor-F1 untuk model KerasClassifier biner saya, tetapi tidak menemukan solusi. Ini kode saya yang sebenarnya: # Split dataset in train and test data X_train, X_test, Y_train, Y_test = train_test_split(normalized_X, Y, test_size=0.3,...
Saat membaca makalah ini ada garis yang mengatakan "pengklasifikasi linear tidak berbagi parameter antara fitur dan kelas." Apa arti dari pernyataan ini? Apakah itu berarti bahwa pengklasifikasi linier seperti regresi logistik membutuhkan fitur yang saling
Ketika saya membaca tentang menggunakan StandardScaler, sebagian besar rekomendasi mengatakan bahwa Anda harus menggunakan StandardScaler sebelum membagi data menjadi kereta / tes, tetapi ketika saya memeriksa beberapa kode yang diposting online (menggunakan sklearn) ada dua kegunaan utama. 1-...
Saya mencoba menemukan formula, metode, atau model yang akan digunakan untuk menganalisis kemungkinan bahwa peristiwa tertentu mempengaruhi beberapa data longitudinal. Saya mengalami kesulitan mencari tahu apa yang harus dicari di Google. Berikut ini sebuah contoh skenario: Image Anda memiliki...
Secara umum, model pembelajaran mesin dibangun di atas kumpulan data. Saya ingin tahu apakah ada cara untuk menghasilkan set data sintetik menggunakan model pembelajaran mesin terlatih yang mempertahankan karakteristik dataset asli? [data asli -> model pembelajaran mesin bangun -> gunakan...
Saya bertanya-tanya bagaimana kita harus memutuskan berapa banyak node di lapisan tersembunyi, dan berapa banyak lapisan tersembunyi untuk diletakkan ketika kita membangun arsitektur jaringan saraf. Saya mengerti layer input dan output tergantung pada set pelatihan yang kita miliki tetapi...
Masalah yang saya tangani adalah mengelompokkan teks-teks pendek menjadi beberapa kelas. Pendekatan saya saat ini adalah menggunakan frekuensi istilah bobot tf-idf dan mempelajari classifier linier sederhana (regresi logistik). Ini bekerja cukup baik (sekitar 90% makro F-1 pada set tes, hampir 100%...
Fungsi aktivasi digunakan untuk memperkenalkan non-linearitas dalam output linear dari tipe w * x + bdalam jaringan saraf. Yang saya bisa mengerti secara intuitif untuk fungsi aktivasi seperti sigmoid. Saya mengerti keuntungan dari ReLU, yaitu menghindari neuron mati selama backpropagation....