Adakah yang bisa memberitahu saya faktor-faktor yang mempengaruhi persyaratan memori berarti pengelompokan dengan sedikit penjelasan?
clustering
k-means
Martin
sumber
sumber
Jawaban:
Algoritma seperti Lloyds dapat diimplementasikan dengan hanya menggunakan nilai floating point memori. Algoritma MacQueens k-means seharusnya hanya membutuhkan memori .k ⋅ ( 2 ⋅ d+ 1 ) k ⋅ ( d+ 1 )
Namun, karena sebagian besar pengguna ingin mengetahui titik mana yang termasuk dalam cluster mana, hampir setiap implementasi yang Anda temukan akan menggunakan memori .O ( n + k ⋅ d)
Dengan kata lain, penggunaan memori dengan k-means pada dasarnya adalah ukuran data output .
sumber
Baru-baru ini saya menemukan sebuah catatan implementasi scipy dari algoritma k-means di scipy.cluster.vq.py
sumber