Saya akan membahas masalah-masalah dalam tugas penugasan tertulis kelas pembelajaran mendalam di Stanford NLP http://cs224d.stanford.edu/assignment1/assignment1_soln
Saya mencoba memahami jawaban untuk 3a di mana mereka mencari turunan ke vektor untuk kata pusat.
Asumsikan Anda diberikan vektor kata yang diprediksi sesuai dengan kata tengah c untuk skipgram, dan prediksi kata dibuat dengan fungsi softmax yang ditemukan dalam model word2vec.
Di mana w menunjukkan kata ke-w dan (w = 1, ..., W) adalah vektor kata “keluaran” untuk semua kata dalam kosakata. Asumsikan biaya entropi silang diterapkan untuk prediksi ini dan kata o adalah kata yang diharapkan.
Di mana adalah matriks dari semua vektor output, dan mari menjadi vektor kolom dari prediksi kata-kata softmax, dan y menjadi label satu-panas yang juga merupakan vektor kolom.
Di mana lintas entropi adalah
Jadi jawaban untuk gradien untuk vektor tengah adalah
Bisakah seseorang menunjukkan kepada saya langkah-langkah untuk mencapai ini? Saya telah menggunakan pertanyaan ini sebagai referensi Derivatif dari kehilangan lintas entropi di word2vec tapi saya secara khusus ingin tahuperwakilan.
sumber