Saya telah mengimplementasikan VAE dan saya perhatikan dua implementasi online berbeda dari divergensi KL gaussian univariat yang disederhanakan. Perbedaan asli sebagai per sini adalah Jika kita menganggap kami sebelumnya adalah unit gaussian yaituμ2=0danσ2=1, menyederhanakan ini ke KLloss=-log(σ1)+σ 2 1 +μ 2 1
Misalnya dalamtutorial Keras autoencoderresmi. Pertanyaan saya kemudian, apa yang saya lewatkan di antara keduanya? Perbedaan utama adalah menjatuhkan faktor 2 pada istilah log dan tidak mengkuadratkan varians. Secara analitis saya telah menggunakan yang terakhir dengan sukses, untuk apa nilainya. Terima kasih sebelumnya atas bantuannya!
sumber
Di sini Anda dapat menemukan derivasi divergensi KL untuk distribusi normal multivarian: Turunkan kehilangan divergensi KL untuk VAEs
sumber