Saya mengerti bagaimana sebuah artificial neural network (ANN)
, dapat dilatih dengan cara yang diawasi menggunakan backpropogation untuk meningkatkan pemasangan dengan mengurangi kesalahan dalam prediksi. Saya telah mendengar bahwa JST dapat digunakan untuk pembelajaran yang tidak diawasi tetapi bagaimana hal ini dapat dilakukan tanpa fungsi biaya untuk memandu tahap optimasi? Dengan k-means atau algoritma EM, ada fungsi yang dicari setiap iterasi untuk meningkat.
- Bagaimana kita bisa melakukan pengelompokan dengan JST dan mekanisme apa yang digunakan untuk mengelompokkan titik data di lokasi yang sama?
(dan kemampuan tambahan apa yang dibawa dengan menambahkan lebih banyak layer ke dalamnya?)
Jawaban:
Jaringan saraf banyak digunakan dalam pembelajaran tanpa pengawasan untuk mempelajari representasi data input yang lebih baik. Sebagai contoh, diberikan satu set dokumen teks, NN dapat belajar pemetaan dari dokumen ke vektor bernilai nyata sedemikian rupa sehingga vektor yang dihasilkan adalah serupa untuk dokumen dengan konten yang sama, yaitu menjaga jarak. Ini dapat dicapai dengan menggunakan, misalnya, auto-encoders - model yang dilatih untuk merekonstruksi vektor asli dari representasi yang lebih kecil (aktivasi lapisan tersembunyi) dengan kesalahan rekonstruksi (jarak dari fungsi ID) sebagai fungsi biaya. Proses ini tidak memberi Anda cluster, tetapi menciptakan representasi bermakna yang dapat digunakan untuk pengelompokan. Anda bisa, misalnya, menjalankan algoritma pengelompokan pada aktivasi lapisan tersembunyi.
Clustering: Ada sejumlah arsitektur NN berbeda yang dirancang khusus untuk clustering. Yang paling banyak dikenal mungkin adalah peta yang bisa diatur sendiri. SOM adalah NN yang memiliki satu set neuron yang terhubung untuk membentuk grid topologis (biasanya persegi panjang). Ketika beberapa pola disajikan ke SOM, neuron dengan vektor bobot terdekat dianggap sebagai pemenang dan bobotnya disesuaikan dengan pola, serta bobot lingkungannya. Dengan cara ini, SOM secara alami menemukan kumpulan data. Algoritma yang agak terkait adalah pertumbuhan gas saraf (tidak terbatas pada jumlah neuron yang telah ditentukan).
Pendekatan lain adalah Teori Resonansi Adaptif di mana kita memiliki dua lapisan: "bidang perbandingan" dan "bidang pengenalan". Bidang pengenalan juga menentukan kecocokan terbaik (neuron) dengan vektor yang ditransfer dari bidang perbandingan dan juga memiliki koneksi penghambatan lateral. Detail implementasi dan persamaan yang tepat dapat dengan mudah ditemukan dengan googling nama-nama model ini, jadi saya tidak akan menempatkannya di sini.
sumber
Anda ingin melihat ke peta pengorganisasian diri . Kohonen (yang menemukan mereka) menulis buku tentang mereka. Ada paket untuk ini di R ( som , kohonen ), dan ada implementasi dalam bahasa lain seperti MATLAB .
sumber