Ilmu Data

8
Cara menerapkan gradien softmax di backprop

Saya baru-baru melakukan pekerjaan rumah di mana saya harus belajar model untuk klasifikasi 10 digit MNIST. HW memiliki beberapa kode perancah dan saya seharusnya bekerja dalam konteks kode ini. Pekerjaan rumah saya bekerja / lulus tes tetapi sekarang saya mencoba untuk melakukan semuanya dari...

8
Gradien Sintetis - apa manfaat praktisnya?

Saya dapat melihat dua motif untuk menggunakan Gradien Sintetis di RNN: Untuk mempercepat pelatihan, dengan segera mengoreksi setiap lapisan dengan gradien yang diprediksi Untuk dapat mempelajari urutan yang lebih lama Saya melihat masalah dengan keduanya. Harap dicatat, saya sangat suka...

8
Apa definisi dimensi VC yang tepat?

Saya mempelajari pembelajaran mesin dari kuliah Andrew Ng Stanford dan baru saja menemukan teori dimensi VC. Menurut ceramah dan apa yang saya mengerti, definisi dimensi VC dapat diberikan sebagai, Jika Anda dapat menemukan satu set nnn poin, sehingga dapat dihancurkan oleh classifier (yaitu...

8
keras 'ModelCheckpoint tidak berfungsi

Saya mencoba untuk melatih model dengan keras dan saya menggunakan ModelCheckpoint untuk menyimpan model terbaik sesuai dengan metrik validasi yang dimonitor (dalam kasus saya indeks Jaccard ). Walaupun saya bisa melihat modelnya meningkat dalam tensorboard, ketika saya mencoba memuat bobot dan...

8
Apakah "kurva" dianggap "linier"?

Dalam regresi linier, kami menyesuaikan polinomial dengan sekumpulan titik data. Dalam buku Bishop tentang Pengenalan Pola & Pembelajaran Mesin, ada beberapa contoh di mana yang cocok adalah kurva atau garis lurus. Saya agak bingung apakah kurva linear atau tidak. Istilah linear berarti bahwa...

7
Mengidentifikasi "kelompok" atau "kelompok" dalam sebuah matriks

Saya memiliki matriks yang diisi dengan elemen diskrit, dan saya perlu mengelompokkannya (menggunakan R) ke dalam kelompok utuh. Jadi, misalnya, ambil matriks ini: [A B B C A] [A A B A A] [A B B C C] [A A A A A] Akan ada dua kelompok terpisah untuk A, dua kelompok terpisah untuk C, dan satu...