Alguém pode me dizer os fatores que afetam os requisitos de memória do cluster mean com um pouco de explicação?
clustering
k-means
Martin
fonte
fonte
Respostas:
Algoritmos como Lloyds podem ser implementados com valores de ponto flutuante usando apenas a memória. O algoritmo k-means do MacQueens deve precisar apenas de memória .k⋅(2⋅d+1) k⋅(d+1)
No entanto, como a maioria dos usuários deseja saber qual ponto pertence a qual cluster, quase todas as implementações que você encontrará usarão memória .O(n+k⋅d)
Em outras palavras, o uso da memória por k-means é essencialmente o tamanho dos dados de saída .
fonte
Recentemente, deparei-me com uma nota explicativa de uma implementação do algoritmo k-means em scipy.cluster.vq.py
fonte