O que o PCA está fazendo com dados correlacionados automaticamente?

9

Só porque alguns correspondentes fizeram uma pergunta interessante a respeito dos métodos de computação da autocorrelação, comecei a brincar com ela, quase sem nenhum conhecimento sobre séries temporais e autocorrelação.

O correspondente organizou seus dados ( pontos de dados de uma série temporal) alterados em um intervalo de tempo cada um, além de ter uma matriz de 32 × 32 dados (como eu o entendi), onde a primeira linha são os dados originais, a segunda linha os dados mudaram em 1 unidade de tempo, a próxima linha por outra e assim por diante. Eu percebi isso adicionalmente colando o final na cauda, ​​criando conjuntos de dados "circulares".3232×321

Então, apenas olhando o que poderia resultar disso, calculei a matriz de correlação e, a partir disso, os principais componentes. Surpreendentemente, consegui a imagem de uma decomposição de frequência e (novamente com outros dados) uma frequência, digamos que com um período nos dados estava no primeiro componente principal e que com quatro períodos estava no segundo PC e assim por diante (Eu tenho 6 PCs "relevantes" com autovalor > 1326>1) Primeiro, pensei que isso dependesse dos dados de entrada, mas agora presumo que seja assim sistematicamente pela construção especial do conjunto de dados com seus turnos circulares (também conhecida como matriz "Toeplitz"). As rotações da solução de PC para varimax ou outros critérios de rotação deram resultados ligeiramente diferentes e possivelmente interessantes, mas, em geral, parecem fornecer essa decomposição de frequência.

Aqui está um link para as fotos que eu fiz do conjunto de dados de pontos; as curvas são simplesmente feitas a partir das cargas da matriz fatorial: uma curva as cargas em um fator. A curva do primeiro PC1 deve mostrar as amplitudes mais altas (aproximadamente porque possui a maior soma de quadrados de carga)32

Questões:

  • T1: este é um recurso por design? (do PCA com este tipo de conjunto de dados)
  • P2: Essa abordagem é de alguma forma útil para uma abordagem séria da análise de frequência / comprimento de onda?

[update] aqui está o conjunto de dados (espero que seja copiável para você)

-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4
-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5
-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3
0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1
2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0
4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2
6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4
5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6
3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5
1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3
1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1
0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1
-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0
-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2
-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3
0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1
3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0
5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3
7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5
6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7
7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6
5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7
4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5
3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4
2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3
3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2
5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3
4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5
3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4
2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3
3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2
4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3
Elmos de Gottfried
fonte
Obrigado @amoeba e pela grande edição. Eu só tinha visto dois erros que queria editar mais tarde, a questão parece muito melhor agora!
Gottfried Helms

Respostas:

4

Deixe-me converter meu comentário anterior em uma resposta.

n=32

n=321n×n

Não faço ideia se pode ser útil (Q2). Na minha experiência, tende a aparecer como um artefato irritante. Ou seja, as pessoas têm alguns dados, obtêm algo parecido com os modos de Fourier do PCA e começam a se perguntar o que eles poderiam significar, enquanto eles são simplesmente devidos a algumas mudanças de tempo na série temporal original.

ameba
fonte
Bem, muito bom, obrigado! Sim, pensei nos dados ao longo das linhas. O Q2 vem também porque eu nunca entendi até hoje como exatamente a análise de Fourier funciona - e por acidente isso poderia ter sido um passo para obter alguma intuição (mas essa vaga esperança realmente parece infrutífera aqui ...)
Gottfried Helms
A propósito, você se importaria de compartilhar sua série temporal de 32 valores? Gostaria de inserir uma figura mostrando a matriz Gram, e poderia fazê-lo diretamente com seus dados.
Ameba
Você viu o link na minha pergunta? Ele redireciona para uma página da Web que criei usando exc.l Possui 4 ou 5 subpáginas, que são selecionáveis ​​por "firefox" na minha instalação por um clique na barra de guias na parte inferior da tela. A primeira subpágina mostra a lista de dados. No entanto verticalmente: deve-se tomá-la como primeira linha em uma nova tabela e adicionar 31 linhas enquanto circula para a direita. Se isso é inconveniente I também pode adicionar os dados em minha pergunta ...
Gottfried Helms
Oh, uau, eu não sabia que era uma planilha on-line inteira, e não apenas uma captura de tela! Obrigado.
Ameba