(Kenapa) Apakah SOM gaya Kohonen tidak disukai?

33

Sejauh yang saya tahu, SOMs gaya Kohonen memiliki puncak kembali sekitar tahun 2005 dan belum melihat banyak bantuan baru-baru ini. Saya belum menemukan kertas yang mengatakan bahwa SOM telah digolongkan dengan metode lain, atau terbukti setara dengan yang lain (pada dimensi yang lebih tinggi, bagaimanapun). Tetapi sepertinya tSNE dan metode lainnya mendapatkan lebih banyak tinta sekarang-sehari, misalnya di Wikipedia, atau di SciKit Learn, dan SOM lebih disebut sebagai metode historis.

(Sebenarnya, artikel Wikipedia tampaknya menunjukkan bahwa SOM terus memiliki keunggulan tertentu dibandingkan pesaing, tetapi juga entri terpendek dalam daftar. EDIT: Permintaan per gung, salah satu artikel yang saya pikirkan adalah: Non Dimensi Dimensi Perhatikan bahwa SOM memiliki lebih sedikit tulisan tentang hal itu daripada metode lainnya. Saya tidak dapat menemukan artikel yang menyebutkan keuntungan yang tampaknya dipertahankan oleh SOM dibandingkan sebagian besar metode lain.)

Ada wawasan? Seseorang bertanya mengapa SOM tidak digunakan, dan mendapat referensi dari beberapa waktu yang lalu, dan saya telah menemukan proses dari konferensi SOM, tetapi bertanya-tanya apakah kebangkitan SVM atau tSNE, dkk, hanya melampaui SOM dalam pembelajaran mesin pop.

EDIT 2: Secara kebetulan, saya baru saja membaca survei 2008 tentang pengurangan dimensi nonlinier malam ini, dan untuk contoh itu hanya menyebutkan: Isomap (2000), embedding linier lokal (LLE) (2000), Hessian LLE (2003), Laplacian eigenmaps (2003), dan semidefinite embedding (SDE) (2004).

Wayne
sumber
3
Bisakah Anda menautkan ke salah satu sumber daya yang Anda maksud? (Misalnya, artikel Wikipedia mana yang "sepertinya menunjukkan ..."?)
gung - Reinstate Monica
11
Mereka tampaknya tidak disukai sampai-sampai saya tidak tahu apa yang dimaksud SOM.
Matthew Drury
5
rupanya, peta mengatur diri sendiri
Christoph Hanck
SOM hanyalah varian dari penskalaan multidimensi (MDS) yang jauh lebih tua.
kjetil b halvorsen
@kjetilbhalvorsen: Apakah Anda memiliki referensi tentang SOM dan MDS? Seperti yang saya pahami, MDS bersifat global (terkait dengan PCA), sedangkan SOM bersifat lokal. Atau mungkin saya salah paham.
Wayne

Jawaban:

18

Saya pikir Anda tertarik pada sesuatu dengan memperhatikan pengaruh apa yang saat ini disebut oleh mesin pembelajaran sebagai algoritma 'terbaik' untuk pengurangan dimensi. Sementara t-SNE telah menunjukkan kemanjurannya dalam kompetisi, seperti Merck Viz Challenge , saya pribadi telah berhasil menerapkan SOM untuk ekstraksi fitur dan klasifikasi biner. Meskipun ada beberapa yang menolak SOM tanpa alasan selain umur algoritme (lihat diskusi ini , ada juga beberapa artikel yang telah diterbitkan dalam beberapa tahun terakhir yang menerapkan SOM dan mencapai hasil positif (lihat Mortazavi et al., 2013 ; Frenkel et al., 2013contohnya). Pencarian Google Cendekia akan mengungkapkan bahwa SOM masih digunakan dalam sejumlah domain aplikasi. Akan tetapi, sebagai aturan umum, algoritma terbaik untuk tugas tertentu persis seperti itu - algoritma terbaik untuk tugas tertentu. Di mana hutan acak mungkin telah bekerja dengan baik untuk tugas klasifikasi biner tertentu, itu mungkin berkinerja buruk pada yang lain. Hal yang sama berlaku untuk tugas pengelompokan, regresi, dan optimasi. Fenomena ini terkait dengan Teorema Tanpa Makan Siang Gratis , tetapi itu adalah topik untuk diskusi lain. Singkatnya, jika SOM bekerja paling baik untuk Anda pada tugas tertentu, itu adalah algoritma yang harus Anda gunakan untuk tugas itu, terlepas dari apa yang populer.

Dirigo
sumber
5

Saya telah melakukan penelitian tentang membandingkan SOM dengan t-SNE dan banyak lagi dan juga mengusulkan perbaikan pada SOM yang membawanya ke tingkat efisiensi baru. Silakan periksa di sini dan beri tahu saya tanggapan Anda. Senang mendapatkan beberapa gagasan tentang apa yang dipikirkan orang tentang hal itu dan apakah layak menerbitkan python untuk digunakan orang.

Tautan IEEE ke kertas: http://ieeexplore.ieee.org/document/6178802/

Implementasi Matlab. https://www.mathworks.com/matlabcentral/fileexchange/35538-cluster-reinforcement--cr--phase

Terima kasih atas tanggapan Anda.

Narine Hall
sumber
4
Selamat Datang di Cross Divalidasi! Ini akan membantu untuk memberikan ringkasan singkat dari temuan Anda, & peningkatan yang Anda buat, & juga mungkin untuk menjawab pertanyaan secara lebih langsung.
Scortchi
1

Pandangan subjektif saya adalah bahwa SOM kurang dikenal dan dianggap kurang 'seksi' daripada banyak metode lain, tetapi masih sangat relevan untuk kelas masalah tertentu. Mungkin mereka memiliki kontribusi yang signifikan jika mereka digunakan secara lebih luas. Mereka sangat berharga dalam tahap awal ilmu data eksplorasi untuk merasakan 'lanskap' atau 'topologi' data multivariat.

Perkembangan perpustakaan seperti Somoclu , dan penelitian seperti itu oleh Guénaël Cabanes (di antara banyak lainnya) menunjukkan bahwa SOM masih relevan.

Matt Wenham
sumber