No agrupamento espectral, é prática padrão resolver o problema do vetor próprio
onde é o gráfico Laplaciano, é o vetor próprio relacionado ao valor próprio .
Minha pergunta: por que se preocupar em pegar o gráfico Laplaciano? Eu não poderia simplesmente resolver o problema do vetor próprio para o próprio gráfico (matriz de afinidade), como o cara fez neste vídeo ?
PS: Fiz a mesma pergunta no CrossValidated, mas acho que esse é um canal mais apropriado. Perdoe-me se eu estiver errado.
machine-learning
clustering
graphs
felipeduque
fonte
fonte
Respostas:
O conceito é o mesmo, mas você está ficando confuso com o tipo de dados. Clustering espectral como Ng et al. O explicação é sobre o agrupamento de dados padrão, enquanto a matriz laplaciana é uma matriz derivada de gráfico usada na teoria algébrica de grafos.
Portanto, o ponto é que sempre que você codifica a semelhança de seus objetos em uma matriz, essa matriz pode ser usada para agrupamento espectral.
Se você tiver dados padrão, ou seja, uma matriz de recurso de amostra, poderá encontrar a proximidade ou afinidade ou o que quiser chamá-lo como matriz e aplicar agrupamento espectral.
Se você tiver um gráfico, essa afinidade seria algo como matriz de adjacência, matriz de distância ou matriz de Laplacialn e resolver a função própria para essa matriz fornece o resultado correspondente.
O ponto sobre o uso de Laplaciano em vez de adjacência é manter a chamada matriz de afinidade positiva semi-definida (e a matriz Laplaciana normalizada é uma escolha melhor, pois fornece valores próprios normalizados entre 0 e 2 e revela a estrutura do gráfico muito melhor).
Portanto, a longa história é que, desde que você tenha uma matriz contendo a afinidade de seus dados, poderá usar o agrupamento espectral em geral. A diferença está nos detalhes (ig propriedade do Laplaciano normalizado que acabei de mencionar)
fonte