Saya ingin tahu perbedaan antara regresi linier dalam analisis pembelajaran mesin reguler dan regresi linier dalam pengaturan "pembelajaran dalam". Algoritma apa yang digunakan untuk regresi linier dalam pengaturan pembelajaran yang
Saya ingin tahu perbedaan antara regresi linier dalam analisis pembelajaran mesin reguler dan regresi linier dalam pengaturan "pembelajaran dalam". Algoritma apa yang digunakan untuk regresi linier dalam pengaturan pembelajaran yang
Saya menyiapkan pencarian grid untuk sekelompok params. Saya mencoba mencari parameter terbaik untuk jaring neural Keras yang melakukan klasifikasi biner. Outputnya adalah 1 atau 0. Ada sekitar 200 fitur. Ketika saya melakukan pencarian kotak, saya mendapat banyak model dan parameternya. Model...
Saya semakin sering mendengar kata-kata ini ketika saya mempelajari pembelajaran mesin. Faktanya, beberapa orang telah memenangkan medali Fields dengan mengerjakan persamaan persamaan. Jadi, saya kira ini adalah istilah yang membawa dirinya dari fisika statistik / matematika ke pembelajaran mesin....
Sementara saya mempelajari Estimasi Kemungkinan Maksimum, untuk melakukan inferensi pada Estimasi Kemungkinan Maksimum, kita perlu mengetahui variansnya. Untuk mengetahui perbedaannya, saya perlu mengetahui Cramer's Rao Lower Bound, yang terlihat seperti Hessian Matrix dengan Second Deriviation...
Dalam kursus pembelajaran mesin, saya belajar bahwa salah satu penggunaan umum PCA ( Principal Component Analysis ) adalah untuk mempercepat algoritma pembelajaran mesin lainnya. Misalnya, bayangkan Anda sedang melatih model regresi logistik. Jika Anda memiliki set pelatihan untuk saya dari 1 ke n...
Setelah melihat pertanyaan ini: Mencoba Meniru Regresi Linier menggunakan Keras , saya telah mencoba untuk memutar contoh saya sendiri, hanya untuk tujuan studi dan untuk mengembangkan intuisi saya. Saya mengunduh dataset sederhana dan menggunakan satu kolom untuk memprediksi yang lain. Data...
Saya tidak pernah yakin kapan harus menggunakan pengodean satu-panas untuk variabel kategori yang tidak dipesan dan kapan tidak. Saya menggunakannya setiap kali algoritma menggunakan metrik jarak untuk menghitung kesamaan. Adakah yang bisa memberikan aturan umum tentang apa jenis algoritma akan...
Kompetisi Kaggle menentukan peringkat akhir berdasarkan set tes yang diadakan. Satu set tes yang diadakan adalah sampel; mungkin tidak mewakili populasi yang dimodelkan. Karena setiap pengiriman seperti hipotesis, algoritme yang memenangkan kompetisi mungkin saja, secara kebetulan, akhirnya cocok...
Fungsi objektif dari Principal Component Analysis (PCA) adalah meminimalkan kesalahan rekonstruksi dalam norma L2 (lihat bagian 2.12 di sini . Pandangan lain sedang mencoba untuk memaksimalkan varians pada proyeksi. Kami juga memiliki posting yang sangat baik di sini: Apa fungsi tujuan PCA ?...
Ditutup . Pertanyaan ini didasarkan pada pendapat . Saat ini tidak menerima jawaban. Ingin meningkatkan pertanyaan ini? Perbarui pertanyaan sehingga dapat dijawab dengan fakta dan kutipan dengan mengedit posting ini . Ditutup 2 tahun yang lalu . Saat ini...
Saya melakukan percobaan pada set validasi EMNIST menggunakan jaringan dengan RMSProp, Adam dan SGD. Saya mencapai akurasi 87% dengan SGD (tingkat belajar 0,1) dan dropout (0,1 dropout prob) serta regularisasi L2 (penalti 1e-05). Saat menguji konfigurasi persis yang sama dengan RMSProp dan Adam...
Saya bertanya-tanya apa nilai intrinsik dari penggunaan rata-rata harmonik (misalnya untuk menghitung ukuran-F), yang bertentangan dengan rata-rata aritmatika tertimbang dalam menggabungkan presisi dan daya ingat? Saya berpikir bahwa rata-rata aritmatika tertimbang dapat memainkan peran rata-rata...
Normalisasi batch telah dikreditkan dengan peningkatan kinerja substansial dalam jaring saraf yang dalam. Banyak materi di internet menunjukkan cara mengimplementasikannya berdasarkan aktivasi-demi-aktivasi. Saya sudah menerapkan backprop menggunakan aljabar matriks, dan mengingat bahwa saya...
Apakah penggunaan "variasi" selalu merujuk ke pengoptimalan melalui inferensi variasional? Contoh: "Pengode-otomatis variasi" "Metode Bayesian Variasional" "Grup renasionalisasi
Fungsi softmax, yang biasa digunakan dalam jaringan saraf untuk mengubah bilangan real menjadi probabilitas, adalah fungsi yang sama dengan distribusi Boltzmann, distribusi probabilitas atas energi untuk ensembel partikel dalam kesetimbangan termal pada suhu T yang diberikan dalam...
Saat ini saya mencoba untuk membungkus kepala saya dengan matematika t-SNE . Sayangnya, masih ada satu pertanyaan yang tidak dapat saya jawab dengan memuaskan: Apa arti sebenarnya dari sumbu dalam grafik t-SNE? Jika saya akan memberikan presentasi tentang topik ini atau memasukkannya ke dalam...
Saya telah mencoba memahami peningkatan gradien membaca berbagai blog, situs web dan mencoba menemukan jawaban saya dengan melihat contohnya misalnya kode sumber XGBoost. Namun, saya tidak bisa menemukan penjelasan yang dapat dimengerti tentang bagaimana algoritma peningkatan gradien menghasilkan...
LSTM dalam kode Keras berikut input_t = Input((4, 1)) output_t = LSTM(1)(input_t) model = Model(inputs=input_t, outputs=output_t) print(model.summary()) dapat direpresentasikan sebagai Saya mengerti bahwa ketika kita memanggil model.predict(np.array([[[1],[2],[3],[4]]]))(hanya) unit LSTM...
Saya tidak menemukan definisi fungsi kerugian pada wiki dalam konteks pembelajaran mesin. ini kurang formal, cukup jelas. Pada intinya, fungsi kerugian sangat sederhana: ini adalah metode untuk mengevaluasi seberapa baik algoritma Anda memodelkan dataset Anda. Jika prediksi Anda benar-benar mati,...
Saya telah melihat ke dalam kerangka teori untuk pemilihan metode (catatan: bukan pemilihan model) dan telah menemukan sangat sedikit kerja sistematis, bermotivasi matematis. Dengan 'pemilihan metode', maksud saya kerangka kerja untuk membedakan metode yang sesuai (atau lebih baik, optimal)...