A melhor maneira de agrupar uma matriz de adjacência

8

Foi difícil interpretar clusters resultantes de uma matriz de adjacência. Eu tenho 200 matrizes relativamente grandes que representam assuntos que contêm correlações parciais (escores z) de séries temporais (dados neurais). O objetivo é agrupar essas 210 matrizes e detectar possíveis comunidades não descobertas. Fiz outros cálculos de correlação parcial, resultando na matriz de adjacência de 200x200. Sempre que executo um algoritmo de detecção de comunidade (por exemplo, o de Newmann), ele aparece com comunidades dificilmente interpretáveis.

A questão é: que tipo de testes estatísticos dirão se essas comunidades ou grupos são significativos? e se sim, existem maneiras sistemáticas de elaborar a interpretação?

Fahd
fonte
Tanto quanto sei, não existe um "caminho certo" único para fazer isso. Uma abordagem seria usar algo como cluster hierárquico na matriz de distância onde ρ são as correlações. A outra coisa é se sua última matriz de correlação capturará relacionamentos significativos. Que medidas foram tomadas para produzi-lo? 1|ρ|ρ
conjectures
Obrigado. Com relação à sua pergunta, o que eu fiz foi correlacionar todas as linhas (ou dados do sujeito) com todos os outros assuntos usando corrcoef (correlação simples) e foi assim que obtive os resultados. Estou tentando detectar os padrões e é por isso que tive que me correlacionar novamente.
Fahd
no PO, sugere-se que os dados do sujeito sejam avaliados com matriz; como isso se torna uma única linha por sujeito?
conjectures

Respostas:

2

Eu fiz alguns trabalhos no passado sobre agrupamento espectral que podem ser úteis aqui. A idéia básica é que se possa usar a matriz de adjacência para formar a chamada matriz de Laplacian:

L=ID1/2AD1/2

(B1,B2)

Abbas
fonte
2

Eu estou olhando para o mesmo problema no momento. Da análise rápida, parece que o agrupamento espectral é a maneira mais "natural" de analisar uma matriz de adjacência. Veja esta postagem do blog para mais detalhes.

Hanan Shteingart
fonte
0

Como alternativa ... Dados neurais (reais ou artificiais) geralmente são uma representação altamente compactada dos dados, o que significa que os dados são muito aleatórios, o que significa que você não encontrará correlações. Qual você tem !! Parabéns! :)

Raio
fonte