Estou tentando entender o uso do PCA em um artigo recente em uma revista intitulado "Mapeando a atividade cerebral em escala com computação em cluster" Freeman et al., 2014 (pdf gratuito disponível no site do laboratório ). Eles usam o PCA em dados de séries temporais e usam os pesos do PCA para criar um mapa do cérebro.
Os dados são dados de imagem com média de avaliação, armazenados como uma matriz (chamada no artigo) com voxels (ou locais de imagem no cérebro) points (a duração de um único estimulação para o cérebro). N× t
Eles usam o SVD resultante em ( indicando a transposição da matriz ).V⊤V
Os autores afirmam que
Os componentes principais (as colunas de ) são vetores de comprimento , e as pontuações (as colunas de ) são vetores de comprimento (número de voxels), descrevendo a projeção de cada voxel na direção dada pelo componente correspondente, formando projeções no volume, ou seja, mapas do cérebro inteiro.T L n
Portanto, os PCs são vetores de comprimento . Como posso interpretar que o "primeiro componente principal explica a maior variação", como é comumente expresso nos tutoriais do PCA? Começamos com uma matriz de muitas séries temporais altamente correlacionadas - como uma única série temporal de PC explica a variação na matriz original? Entendo toda a coisa "rotação de uma nuvem gaussiana de pontos para o eixo mais variado", mas não tenho certeza de como isso se relaciona com as séries temporais. O que os autores querem dizer com direção quando afirmam: "as pontuações (as colunas de ) são vetores de comprimento n (número de voxels), descrevendo a projeção de cada voxel na direção dada pelo componente correspondente "? Como um curso do componente principal pode ter uma direção?
Para ver um exemplo das séries temporais resultantes das combinações lineares dos componentes principais 1 e 2 e o mapa cerebral associado, vá para o link a seguir e passe o mouse sobre os pontos no gráfico XY.
Minha segunda pergunta está relacionada às trajetórias (espaço de estado) que eles criam usando as pontuações dos componentes principais.
Eles são criados com base nas primeiras 2 pontuações (no caso do exemplo "optomotor" que descrevi acima) e projetamos as tentativas individuais (usadas para criar a matriz média de tentativas descrita acima) no subespaço principal pela equação:
Como você pode ver pelos filmes vinculados, cada traço no espaço de estados representa a atividade do cérebro como um todo.
Alguém pode fornecer a intuição para o significado de cada "quadro" do filme espacial, em comparação com a figura que associa o gráfico XY das pontuações dos 2 primeiros PCs. O que significa, em um determinado "quadro", que 1 tentativa do experimento esteja em 1 posição no espaço de estado XY e outra tentativa esteja em outra posição? Como as posições de plotagem XY nos filmes se relacionam com os principais rastreamentos de componentes na figura vinculada mencionada na primeira parte da minha pergunta?
fonte
Respostas:
Q1: Qual é a conexão entre séries temporais de PC e "variação máxima"?
Os dados que eles estão analisando são t pontos de dados para cada um dos n neurônios, assim pode-se pensar nisso como t pontos de dados no n espaço dimensional R n . É "uma nuvem de pontos", portanto, executar o PCA equivale a encontrar direções de variação máxima, como você bem sabe. Prefiro chamar essas direções (que são vetores próprios da matriz de covariância) de "eixos principais" e as projeções dos dados sobre essas direções de "componentes principais".t^ n t^ n Rn
Quando análise de séries de tempo, a única adição a esta imagem é que os pontos são significativamente ordenada, ou numeradas (a partir de a t ), em vez de ser simplesmente uma desordenada colecção de pontos. O que significa que, se levarmos taxa de um único neurônio disparando (que é uma coordenada no R n ), então os seus valores podem ser plotados em função do tempo. Da mesma forma, se tomarmos um PC (que é uma projecção de R n em alguns linha), em seguida, ele também tem t valores e pode ser representada graficamente como uma função do tempo. Portanto, se os recursos originais são séries temporais, os PCs também são séries temporais.1 t^ Rn Rn t^
Concordo com a interpretação do @ Nestor acima: cada recurso original pode ser visto como uma combinação linear de PCs, e como os PCs não estão correlacionados entre si, pode-se pensar neles como funções básicas nas quais os recursos originais são decompostos. É um pouco como a análise de Fourier, mas em vez de usar uma base fixa de senos e cossenos, estamos encontrando a base "mais apropriada" para esse conjunto de dados em particular, no sentido de que primeiro o PC é o responsável pela maior variação, etc.
"Contabilizando a maior variação" aqui significa que, se você pegar apenas uma função básica (série temporal) e tentar aproximar todos os seus recursos, o primeiro PC fará o melhor trabalho. Portanto, a intuição básica aqui é que o primeiro PC é uma série temporal de funções básicas que se encaixa melhor em todas as séries temporais disponíveis, etc.
Por que essa passagem em Freeman et al. tão confuso?
A frase que você citou de Freeman et al. é bastante confuso:
Acho isso muito confuso e, portanto, sugiro ignorar a escolha de palavras, mas apenas observe as fórmulas. A partir deste ponto, continuarei usando os termos como eu quiser, não como Freeman et al. usa-os.
P2: Quais são as trajetórias do espaço de estados?
fonte
Com relação à segunda questão. A equação dada é
Eu não lidei com a metodologia de coloração antes, e levaria um tempo antes que eu estivesse confiante para comentar sobre esse aspecto. Achei o comentário sobre a similaridade com a Fig 4c confuso, pois a coloração é obtida por meio de regressão per-voxel. Enquanto na Fig. 6 cada traço é um artefato de imagem inteira. A menos que eu seja sincero, acho que é a direção do estímulo durante esse segmento de tempo, conforme o comentário na Figura.
fonte