Os dados do mundo real às vezes têm um número natural de clusters (tentar agrupá-los em um número menor de clusters do que um k mágico causará um aumento dramático no custo de cluster). Hoje assisti a uma palestra do Dr. Adam Meyerson e ele se referiu a esse tipo de dados como "dados separáveis".
Quais são algumas formalizações de cluster, que não sejam meios K, que podem ser passíveis de algoritmos de cluster (aproximações ou heurísticas) que explorariam a separabilidade natural dos dados?
fonte