Peta yang diatur sendiri vs kernel k-means

8

Untuk aplikasi, saya ingin mengelompokkan data (berpotensi berdimensi tinggi) dan mengekstraksi kemungkinan milik sebuah cluster. Saya mempertimbangkan pada saat ini peta mengatur diri sendiri atau kernel k-cara untuk melakukan pekerjaan. Apa pro dan kontra dari setiap classifier untuk tugas ini? Apakah saya kehilangan algoritme pengelompokan orang lain yang bisa tampil dalam kasus ini?

WAF
sumber

Jawaban:

5

Ini berpotensi menjadi pertanyaan yang menarik. Algoritma pengelompokan berkinerja 'baik' atau 'tidak-baik' tergantung pada topologi data Anda dan apa yang Anda cari dalam data itu. ¿Apa yang Anda inginkan untuk diwakili oleh cluster? Saya melampirkan diagram yang sayangnya tidak menyertakan kernel k-means atau SOM tapi saya pikir ini sangat berharga untuk memahami perbedaan besar antara teknik. Anda mungkin perlu bertanya dan merespons ini pada diri Anda sendiri sebelum Anda menggali untuk mengukur "pro" dan "kontra".

teknik pengelompokan Ini adalah sumber gambar.

JEquihua
sumber
Terima kasih untuk anwser terperinci. Saya percaya maksud saya adalah untuk mengklasifikasikan data lebih seperti propagasi Afinitas.
WAF