Saya mencoba untuk bekerja dengan cara saya melalui set masalah pertama dari materi kursus stanford kelas cs224d online dan saya mengalami beberapa masalah dengan masalah 3A: Ketika menggunakan model skip gram word2vec dengan fungsi prediksi softmax dan fungsi kehilangan entropi silang, kami ingin menghitung gradien sehubungan dengan vektor kata yang diprediksi. Jadi diberikan fungsi softmax:
dan fungsi lintas entropi:
kita perlu menghitung
Langkah-langkah saya adalah sebagai berikut:
sekarang diberikan adalah satu vektor panas dan saya adalah kelas yang benar:
Apakah ini benar atau dapatkah itu disederhanakan lebih lanjut? Saya ingin memastikan bahwa saya berada di jalur yang benar karena solusi masalah tidak diposting secara online. Plus mendapatkan tugas tertulis yang benar adalah penting untuk dapat melakukan tugas pemrograman dengan benar.
sumber
Jawaban:
sumber