Dado um conjunto de pontos de dados Onde corremos K-significa em e obtenha os clusters .
Agora, se criar um novo conjunto de dados onde e e executar K-means em para obter aglomerados .
Em que condições de e temos a garantia de obter os mesmos agrupamentos?
Vamos supor que K-means esteja usando a distância euclidiana e tenha as mesmas condições iniciais em ambos os algoritmos, ou seja, se os centros iniciais de X forem , os centros iniciais de Y serão onde .
Até agora, pensei que tivesse que ter classificação completa possa ser qualquer vetor. No entanto, não pude provar isso.
fonte