Pertanyaan yang diberi tag machine-learning

12

Apa perbedaan antara regresi linier 'reguler' dan regresi linier deep learning?

Saya ingin tahu perbedaan antara regresi linier dalam analisis pembelajaran mesin reguler dan regresi linier dalam pengaturan "pembelajaran dalam". Algoritma apa yang digunakan untuk regresi linier dalam pengaturan pembelajaran yang

regression machine-learning deep-learning

12

Keras: mengapa kehilangan berkurang sementara val_loss meningkat?

Saya menyiapkan pencarian grid untuk sekelompok params. Saya mencoba mencari parameter terbaik untuk jaring neural Keras yang melakukan klasifikasi biner. Outputnya adalah 1 atau 0. Ada sekitar 200 fitur. Ketika saya melakukan pencarian kotak, saya mendapat banyak model dan parameternya. Model...

machine-learning cross-validation deep-learning tensorflow theano

12

Apa itu Keteraturan dan Regulasi?

Saya semakin sering mendengar kata-kata ini ketika saya mempelajari pembelajaran mesin. Faktanya, beberapa orang telah memenangkan medali Fields dengan mengerjakan persamaan persamaan. Jadi, saya kira ini adalah istilah yang membawa dirinya dari fisika statistik / matematika ke pembelajaran mesin....

machine-learning self-study terminology regularization definition

12

Hubungan antara Matriks Hessian dan Matriks Kovarian

Sementara saya mempelajari Estimasi Kemungkinan Maksimum, untuk melakukan inferensi pada Estimasi Kemungkinan Maksimum, kita perlu mengetahui variansnya. Untuk mengetahui perbedaannya, saya perlu mengetahui Cramer's Rao Lower Bound, yang terlihat seperti Hessian Matrix dengan Second Deriviation...

machine-learning mathematical-statistics maximum-likelihood data-mining

12

Mengapa kita menggunakan PCA untuk mempercepat algoritma pembelajaran padahal kita bisa mengurangi jumlah fitur?

Dalam kursus pembelajaran mesin, saya belajar bahwa salah satu penggunaan umum PCA ( Principal Component Analysis ) adalah untuk mempercepat algoritma pembelajaran mesin lainnya. Misalnya, bayangkan Anda sedang melatih model regresi logistik. Jika Anda memiliki set pelatihan untuk saya dari 1 ke n...

machine-learning pca

12

Regresi Linier Sederhana dalam Keras

Setelah melihat pertanyaan ini: Mencoba Meniru Regresi Linier menggunakan Keras , saya telah mencoba untuk memutar contoh saya sendiri, hanya untuk tujuan studi dan untuk mengembangkan intuisi saya. Saya mengunduh dataset sederhana dan menggunakan satu kolom untuk memprediksi yang lain. Data...

regression machine-learning neural-networks linear keras

12

Algoritma apa yang membutuhkan pengodean satu-panas?

Saya tidak pernah yakin kapan harus menggunakan pengodean satu-panas untuk variabel kategori yang tidak dipesan dan kapan tidak. Saya menggunakannya setiap kali algoritma menggunakan metrik jarak untuk menghitung kesamaan. Adakah yang bisa memberikan aturan umum tentang apa jenis algoritma akan...

machine-learning categorical-data categorical-encoding data-preprocessing

12

Apakah kompetisi Kaggle baru saja dimenangkan secara kebetulan?

Kompetisi Kaggle menentukan peringkat akhir berdasarkan set tes yang diadakan. Satu set tes yang diadakan adalah sampel; mungkin tidak mewakili populasi yang dimodelkan. Karena setiap pengiriman seperti hipotesis, algoritme yang memenangkan kompetisi mungkin saja, secara kebetulan, akhirnya cocok...

machine-learning probability hypothesis-testing sample kaggle

12

Apakah optimasi PCA cembung?

Fungsi objektif dari Principal Component Analysis (PCA) adalah meminimalkan kesalahan rekonstruksi dalam norma L2 (lihat bagian 2.12 di sini . Pandangan lain sedang mencoba untuk memaksimalkan varians pada proyeksi. Kami juga memiliki posting yang sangat baik di sini: Apa fungsi tujuan PCA ?...

machine-learning pca optimization convex

12

Apakah regresi linier sudah usang? [Tutup]

Ditutup . Pertanyaan ini didasarkan pada pendapat . Saat ini tidak menerima jawaban. Ingin meningkatkan pertanyaan ini? Perbarui pertanyaan sehingga dapat dijawab dengan fakta dan kutipan dengan mengedit posting ini . Ditutup 2 tahun yang lalu . Saat ini...

regression machine-learning linear teaching

12

RMSProp dan Adam vs SGD

Saya melakukan percobaan pada set validasi EMNIST menggunakan jaringan dengan RMSProp, Adam dan SGD. Saya mencapai akurasi 87% dengan SGD (tingkat belajar 0,1) dan dropout (0,1 dropout prob) serta regularisasi L2 (penalti 1e-05). Saat menguji konfigurasi persis yang sama dengan RMSProp dan Adam...

machine-learning optimization sgd adam

12

Mengapa kita tidak menggunakan rata-rata aritmatika tertimbang alih-alih rata-rata harmonik?

Saya bertanya-tanya apa nilai intrinsik dari penggunaan rata-rata harmonik (misalnya untuk menghitung ukuran-F), yang bertentangan dengan rata-rata aritmatika tertimbang dalam menggabungkan presisi dan daya ingat? Saya berpikir bahwa rata-rata aritmatika tertimbang dapat memainkan peran rata-rata...

machine-learning monte-carlo precision-recall harmonic-mean

12

Matriks berupa backpropagation dengan normalisasi batch

Normalisasi batch telah dikreditkan dengan peningkatan kinerja substansial dalam jaring saraf yang dalam. Banyak materi di internet menunjukkan cara mengimplementasikannya berdasarkan aktivasi-demi-aktivasi. Saya sudah menerapkan backprop menggunakan aljabar matriks, dan mengingat bahwa saya...

machine-learning neural-networks deep-learning backpropagation batch-normalization

12

Apa yang dimaksud dengan "variasi"?

Apakah penggunaan "variasi" selalu merujuk ke pengoptimalan melalui inferensi variasional? Contoh: "Pengode-otomatis variasi" "Metode Bayesian Variasional" "Grup renasionalisasi

machine-learning optimization inference

12

Seberapa dalam hubungan antara fungsi softmax dalam ML dan distribusi Boltzmann dalam termodinamika?

Fungsi softmax, yang biasa digunakan dalam jaringan saraf untuk mengubah bilangan real menjadi probabilitas, adalah fungsi yang sama dengan distribusi Boltzmann, distribusi probabilitas atas energi untuk ensembel partikel dalam kesetimbangan termal pada suhu T yang diberikan dalam...

machine-learning neural-networks softmax

12

Apa arti sumbu pada t-SNE?

Saat ini saya mencoba untuk membungkus kepala saya dengan matematika t-SNE . Sayangnya, masih ada satu pertanyaan yang tidak dapat saya jawab dengan memuaskan: Apa arti sebenarnya dari sumbu dalam grafik t-SNE? Jika saya akan memberikan presentasi tentang topik ini atau memasukkannya ke dalam...

machine-learning dimensionality-reduction tsne

12

Bagaimana meningkatkan gradien menghitung estimasi probabilitas?

Saya telah mencoba memahami peningkatan gradien membaca berbagai blog, situs web dan mencoba menemukan jawaban saya dengan melihat contohnya misalnya kode sumber XGBoost. Namun, saya tidak bisa menemukan penjelasan yang dapat dimengerti tentang bagaimana algoritma peningkatan gradien menghasilkan...

machine-learning classification boosting ensemble xgboost

12

Perbedaan antara satu unit LSTM dan 3-unit jaringan saraf LSTM

LSTM dalam kode Keras berikut input_t = Input((4, 1)) output_t = LSTM(1)(input_t) model = Model(inputs=input_t, outputs=output_t) print(model.summary()) dapat direpresentasikan sebagai Saya mengerti bahwa ketika kita memanggil model.predict(np.array([[[1],[2],[3],[4]]]))(hanya) unit LSTM...

machine-learning neural-networks lstm keras

12

Apakah KNN memiliki fungsi kerugian?

Saya tidak menemukan definisi fungsi kerugian pada wiki dalam konteks pembelajaran mesin. ini kurang formal, cukup jelas. Pada intinya, fungsi kerugian sangat sederhana: ini adalah metode untuk mengevaluasi seberapa baik algoritma Anda memodelkan dataset Anda. Jika prediksi Anda benar-benar mati,...

machine-learning

11

Apa sajakah kerangka kerja yang baik untuk pemilihan metode?

Saya telah melihat ke dalam kerangka teori untuk pemilihan metode (catatan: bukan pemilihan model) dan telah menemukan sangat sedikit kerja sistematis, bermotivasi matematis. Dengan 'pemilihan metode', maksud saya kerangka kerja untuk membedakan metode yang sesuai (atau lebih baik, optimal)...

machine-learning methodology theory