Tutorial yang bagus untuk Mesin Boltzmann Terbatas (RBM)

10

Saya sedang mempelajari Mesin Boltzmann Terbatas (RBM) dan saya mengalami beberapa masalah dalam memahami perhitungan kemungkinan log sehubungan dengan parameter RBM. Meskipun banyak makalah penelitian tentang RBM telah diterbitkan, tidak ada langkah rinci dari turunannya. Setelah mencari online, saya dapat menemukannya di dokumen ini:

Fischer, A., & Igel, C. (2012). Pengantar Mesin Boltzmann Terbatas. Dalam L. Alvarez et al. (Eds.): CIARP, LNCS 7441, hlm. 14–36, Springer-Verlag: Berlin-Heidelberg. ( pdf )

Namun, rincian dokumen ini terlalu canggih untuk saya. Adakah yang bisa mengarahkan saya ke tutorial / set catatan kuliah yang bagus tentang RBM?

Edit: @ David, bagian yang membingungkan ditunjukkan di bawah ini (persamaan 29 di halaman 26):

$\begin{aligned} \frac{\partial \ln L (θ | v)}{\partial w_{i j}} & = - \sum_{h} p (h | v) \frac{\partial E (v, h)}{\partial w_{i j}} + \sum_{v, h} p (v, h) \frac{\partial E (v, h)}{\partial w_{i j}} \\ = \sum_{h} p (h | v) h_{i} v_{j} - \sum_{v} p (v) \sum_{h} p (h | v) h_{i} v_{j} \\ (29) & = p (H_{i} = 1 | v) v_{j} - \sum_{v} p (v) p (H_{i} = 1 | v) v_{j} . \end{aligned}$ $\begin{align} \frac{\partial\ln\mathcal{L}(\theta|v)}{\partial w_{ij}} &= -\sum_h p(h|v)\frac{\partial E(v, h)}{\partial w_{ij}} + \sum_{v,h} p(v,h)\frac{\partial E(v,h)}{\partial w_{ij}} \\[5pt] &= \sum_h p(h|v)h_iv_j - \sum_v p(v) \sum_h p(h|v)h_iv_j \\[5pt] &= \color{orange}{\boxed{\color{black}{p(H_i=1|v)}}}v_j - \sum_v p(v) \color{orange}{\boxed{\color{black}{p(H_i=1|v)}}}v_j\; . \tag{29} \end{align}$

references rbm Upul
sumber

Bisakah Anda lebih spesifik tentang langkah-langkah apa yang membingungkan Anda?

David J. Harris

1

bacaan yang baik adalah bab 5 mempelajari arsitektur yang mendalam untuk AI ( iro.umontreal.ca/ ~ bengioy / papers / ftml_book.pdf )

dksahuji

@dksahuji terima kasih untuk INFO, juga prof: Bengio sedang menulis DL dan inital draft tersedia di iro.umontreal.ca/~bengioy/dlbook

Upul

Tutorial ini memiliki penjelasan tentang matematika RBM ( Tutorial tentang Mesin Boltzmann Terbatas ).

Jiang Xiang

7

Saya tahu ini agak terlambat, tapi mungkin bisa membantu. Untuk mendapatkan istilah pertama dari persamaan Anda, diperlukan langkah-langkah ini: Kami telah mengasumsikan bahwa kemerdekaan bersyarat antara unit tersembunyi, mengingat unit yang terlihat, ada. Dengan demikian kita dapat memfaktorkan distribusi probabilitas gabungan kondisional untuk kondisi tersembunyi.

\begin{aligned} \sum_{h} p (h | v) h_{i} v_{j} & = v_{j} \sum_{h_{1}} . . . \sum_{h_{i}} . . . \sum_{h_{n}} p (h_{1}, . . ., h_{i}, . . . h_{n} | v) h_{i} \\ = v_{j} \sum_{h_{i}} \sum_{h_{_i}} p (h_{i}, h_{_i} | v) h_{i} \end{aligned}

$\begin{align} \sum_{\mathbf{h}} p(\mathbf{h} | \mathbf{v})h_iv_j &= v_j \sum_{h_1}...\sum_{h_i}...\sum_{h_n} p(h_1,...,h_i,...h_n | \mathbf{v}) h_i \\[5pt] &= v_j \sum_{h_i} \sum_{\mathbf{h_{\_ i}}}p(h_i, \mathbf{h_{\_i}} | \mathbf{v}) h_i \end{align}$

\begin{aligned} = v_{j} \sum_{h_{i}} \sum_{h_{_i}} p (h_{i} | v) h_{i} p (h_{_i} | v) \\ = v_{j} \sum_{h_{i}} p (h_{i} | v) h_{i} \sum_{h_{_i}} p (h_{_i} | v) \end{aligned}

$\begin{align} &= v_j \sum_{h_i} \sum_{\mathbf{h_{\_ i}}} p(h_i | \mathbf{v}) h_i \: p(\mathbf{h_{\_ i}}|\mathbf{v}) \\[5pt] &= v_j \sum_{h_i} p(h_i | \mathbf{v}) h_i \: \sum_{\mathbf{h_{\_ i}}} p(\mathbf{h_{\_ i}}|\mathbf{v}) \end{align}$ Istilah terakhir sama dengan , karena kita menjumlahkan semua negara bagian. Jadi apa yang tersisa, adalah istilah pertama. Karena hanya mengambil status dan kita berakhir dengan:

1

$1$

h_{i}

$h_i$

1

$1$

0

$0$

= v_{j} p (H_{i} = 1 | v)

$\hspace{-25mm}= v_j \: p(H_i = 1 | \mathbf{v})$

peschn
sumber

7

Ada tutorial RBM yang layak di situs deeplearning .
Posting blog ini ( Pengantar Mesin Boltzmann Terbatas ) ditulis dalam bahasa yang lebih sederhana dan menjelaskan dasar-dasar RBMS dengan sangat baik:
Juga, mungkin referensi terbaik adalah kursus Jaringan Neural Geoff Hinton di Coursea:

Saya tidak yakin apakah Anda dapat mengakses kelas dan video setelah kelas berakhir.

sjm.majewski
sumber

2

Masih ada orang yang mendaftar ke kelas Coursera dan memposting di forum. Anda masih dapat melihat semua kuliah, dan mengakses semua kuis dan tugas pemrograman (di antara kuis). Informasi ini mungkin akan sampai kursus ditawarkan lagi. Saya sarankan mendaftar di kursus hanya untuk melihat atau mengunduh materi.

Douglas Zare

1

Kotak oranye kiri memberi Anda nilai yang diharapkan dari gradien energi di atas semua konfigurasi tersembunyi mengingat bahwa beberapa vektor terlihat dijepit pada unit yang terlihat (harapan atas data karena menggunakan sampel dari set pelatihan Anda). Istilah itu sendiri adalah produk dari (1) probabilitas untuk melihat unit tersembunyi tertentu i pada mengingat bahwa beberapa vektor v dijepit pada unit yang terlihat dan (2) keadaan unit terlihat tertentu j.

Kotak oranye kanan adalah hal yang sama dengan yang kiri, kecuali Anda melakukan apa yang ada di kotak oranye kiri untuk setiap konfigurasi yang mungkin terlihat, bukan hanya yang dijepit pada unit yang terlihat (harapan atas model karena tidak ada yang dijepit pada unit yang terlihat).

avalon
sumber

1

Bab 5 dari pelajaran Hugo Larochelle tentang pembelajaran mesin ( video ) adalah pengantar terbaik yang saya temukan sejauh ini.

Turunan dari fungsi kerugian tidak diturunkan dalam kuliah ini tetapi tidak sulit untuk melakukannya (saya dapat memposting pemindaian kalkulasi saya jika diperlukan, tetapi sebenarnya tidak terlalu sulit). Saya masih mencari buku teks yang bagus yang membahas topik ini tetapi terutama hanya ada artikel. Ada ikhtisar yang baik dari artikel-artikel di Bab 20 Buku Pembelajaran Jauh Bengio .

jakab922
sumber

Tutorial yang bagus untuk Mesin Boltzmann Terbatas (RBM)

Jawaban: