Saya sedang mempelajari Mesin Boltzmann Terbatas (RBM) dan saya mengalami beberapa masalah dalam memahami perhitungan kemungkinan log sehubungan dengan parameter RBM. Meskipun banyak makalah penelitian tentang RBM telah diterbitkan, tidak ada langkah rinci dari turunannya. Setelah mencari online, saya dapat menemukannya di dokumen ini:
- Fischer, A., & Igel, C. (2012). Pengantar Mesin Boltzmann Terbatas. Dalam L. Alvarez et al. (Eds.): CIARP, LNCS 7441, hlm. 14–36, Springer-Verlag: Berlin-Heidelberg. ( pdf )
Namun, rincian dokumen ini terlalu canggih untuk saya. Adakah yang bisa mengarahkan saya ke tutorial / set catatan kuliah yang bagus tentang RBM?
Edit: @ David, bagian yang membingungkan ditunjukkan di bawah ini (persamaan 29 di halaman 26):
references
rbm
Upul
sumber
sumber
Jawaban:
Saya tahu ini agak terlambat, tapi mungkin bisa membantu. Untuk mendapatkan istilah pertama dari persamaan Anda, diperlukan langkah-langkah ini: Kami telah mengasumsikan bahwa kemerdekaan bersyarat antara unit tersembunyi, mengingat unit yang terlihat, ada. Dengan demikian kita dapat memfaktorkan distribusi probabilitas gabungan kondisional untuk kondisi tersembunyi.
sumber
Ada tutorial RBM yang layak di situs deeplearning .
Posting blog ini ( Pengantar Mesin Boltzmann Terbatas ) ditulis dalam bahasa yang lebih sederhana dan menjelaskan dasar-dasar RBMS dengan sangat baik:
Juga, mungkin referensi terbaik adalah kursus Jaringan Neural Geoff Hinton di Coursea:
Saya tidak yakin apakah Anda dapat mengakses kelas dan video setelah kelas berakhir.
sumber
Kotak oranye kiri memberi Anda nilai yang diharapkan dari gradien energi di atas semua konfigurasi tersembunyi mengingat bahwa beberapa vektor terlihat dijepit pada unit yang terlihat (harapan atas data karena menggunakan sampel dari set pelatihan Anda). Istilah itu sendiri adalah produk dari (1) probabilitas untuk melihat unit tersembunyi tertentu i pada mengingat bahwa beberapa vektor v dijepit pada unit yang terlihat dan (2) keadaan unit terlihat tertentu j.
Kotak oranye kanan adalah hal yang sama dengan yang kiri, kecuali Anda melakukan apa yang ada di kotak oranye kiri untuk setiap konfigurasi yang mungkin terlihat, bukan hanya yang dijepit pada unit yang terlihat (harapan atas model karena tidak ada yang dijepit pada unit yang terlihat).
sumber
Bab 5 dari pelajaran Hugo Larochelle tentang pembelajaran mesin ( video ) adalah pengantar terbaik yang saya temukan sejauh ini.
Turunan dari fungsi kerugian tidak diturunkan dalam kuliah ini tetapi tidak sulit untuk melakukannya (saya dapat memposting pemindaian kalkulasi saya jika diperlukan, tetapi sebenarnya tidak terlalu sulit). Saya masih mencari buku teks yang bagus yang membahas topik ini tetapi terutama hanya ada artikel. Ada ikhtisar yang baik dari artikel-artikel di Bab 20 Buku Pembelajaran Jauh Bengio .
sumber