No PCA, faz diferença se escolhermos os principais componentes da matriz de covariância inversa OU se deixarmos cair autovetores da matriz de covariância correspondentes a grandes valores próprios? Isso está relacionado à discussão neste post
No PCA, faz diferença se escolhermos os principais componentes da matriz de covariância inversa OU se deixarmos cair autovetores da matriz de covariância correspondentes a grandes valores próprios? Isso está relacionado à discussão neste post
Estou com dificuldades para selecionar a maneira correta de visualizar dados. Digamos que temos livrarias que vendem livros , e todo livro tem pelo menos uma categoria . Para uma livraria, se contarmos todas as categorias de livros, adquirimos um histograma que mostra o número de livros que se...
Vários pacotes estatísticos, como SAS, SPSS e R, permitem executar algum tipo de rotação de fator após um PCA. Por que uma rotação é necessária após um PCA? Por que você aplicaria uma rotação oblíqua após uma APC, uma vez que o objetivo da APC é produzir dimensões...
É possível usar a análise de componentes principais do kernel (kPCA) para Indexação Semântica Latente (LSI) da mesma maneira que o PCA é usado? Realizo o LSI em R usando a prcompfunção PCA e extraio os recursos com cargas mais altas dos primeiros componentes. Com isso, recebo os recursos que...
Eu tenho um conjunto de dados de eventos que ocorreram durante o mesmo período de tempo. Cada evento tem um tipo (existem poucos tipos diferentes, menos de dez) e um local, representado como um ponto 2D. Gostaria de verificar se há alguma correlação entre os tipos de eventos ou entre o tipo e o...
Dado dois conjuntos de dados multidimensionais, e Y , algumas pessoas realizam análises multivariáveis criando uma variável dependente substituta usando a análise de componentes principais (PCA). Ou seja, execute PCA no conjunto Y , faça pontuações ao longo do primeiro componente y ' e execute...
Realizei uma decomposição SVD e um dimensionamento multidimensional de uma matriz de dados tridimensional, a fim de obter uma melhor compreensão da estrutura dos dados. Infelizmente, todos os valores singulares são da mesma ordem, implicando que a dimensionalidade dos dados é realmente 6. No...
Questão: Existem diretrizes gerais com relação às características dos dados de entrada que podem ser usadas para decidir entre aplicar o PCA versus o LSA / LSI? Breve resumo do PCA vs. LSA / LSI: A Análise de Componentes Principais (PCA) e a Análise Semântica Latente (LSA) ou Indexação Semântica...
Como eu usaria a saída de uma análise de componentes principais (PCA) em um modelo linear generalizado (GLM), assumindo que o PCA é usado para seleção de variáveis para o GLM? Esclarecimento: Eu quero usar o PCA para evitar o uso de variáveis correlacionadas no GLM. No entanto, o PCA me...
Imagine que você tem um polígono definido por um conjunto de coordenadas e seu centro de massa é . Você pode tratar o polígono como uma distribuição uniforme com um limite poligonal. (x1,y1)...(xn,yn)(x1,y1)...(xn,yn)(x_1,y_1)...(x_n,y_n)(0,0)(0,0)(0,0) Estou atrás de um método que encontrará a...
Eu tenho um conjunto de dados de variáveis discretas (ordinais, merísticas e nominais) que descrevem caracteres morfológicos das asas em várias espécies de insetos intimamente relacionadas. O que pretendo fazer é realizar algum tipo de análise que me dê uma representação visual da semelhança das...
Lendo a Wikipedia sobre análise de correlação canônica (CCA) para dois vetores aleatórios e Y , eu queria saber se a análise principal de componentes (PCA) é a mesma que CCA quando X = Y ?XXXYYYX=
Estou usando um classificador baseado em redes neurais para executar uma classificação para meus dados em n-dimensional. Então, pensei que seria uma boa ideia executar a redução de dimensão como PCA para meus dados primeiro e depois colocar os resultados do PCA no classificador (eu mantenho 3...
Estou analisando um conjunto de dados sobre comunidades entre marés. Os dados são cobertura percentual (de algas, cracas, mexilhões etc.) em quadrantes. Estou acostumado a pensar na análise de correspondência (CA) em termos de contagem de espécies e na análise de componentes principais (PCA) como...
Eu tenho diferentes variáveis que interagem dentro de uma população. Basicamente, tenho feito um inventário de milípedes e medido alguns outros valores do terreno, como: As espécies e a quantidade de espécimes coletados Os diferentes ambientes onde os animais estão o pH A porcentagem de...
Estou tentando entender a saída da análise de componentes principais executada da seguinte maneira: > head(iris) Sepal.Length Sepal.Width Petal.Length Petal.Width Species 1 5.1 3.5 1.4 0.2 setosa 2 4.9 3.0 1.4 0.2 setosa 3 4.7 3.2 1.3 0.2 setosa 4 4.6 3.1 1.5 0.2 setosa 5 5.0 3.6 1.4 0.2...
Suponha é uma matriz de dados centralizados na média. A matriz é , possui autovalores distintos e vetores próprios \ mathbf s_1 , \ mathbf s_2 ... \ mathbf s_m , ortogonais.S = cov ( A ) m × m m s 1UMAA\mathbf AS =cov( A )S=cov(A)\mathbf S=\text{cov}(\mathbf A)m × mm×mm\times mmmms1 1s1\mathbf s_1s...
Eu li sobre o básico da análise de componentes principais no tutorial1 , link1 e link2 . Eu tenho um conjunto de dados de 100 variáveis (incluindo a variável de saída Y), quero reduzir as variáveis para 40 pelo PCA e prever a variável Y usando essas 40 variáveis. Problema 1: Após obter os...
Eu tenho um conjunto de dados de mais de 1000 amostras de 19 variáveis. Meu objetivo é prever uma variável binária com base nas outras 18 variáveis (binárias e contínuas). Estou bastante confiante de que seis das variáveis de previsão estão associadas à resposta binária, no entanto, gostaria de...
Estou tentando reduzir a dimensionalidade e o ruído de um conjunto de dados executando o PCA no conjunto de dados e jogando fora os últimos PCs. Depois disso, quero usar alguns algoritmos de aprendizado de máquina nos PCs restantes e, portanto, quero normalizar os dados equalizando a variação dos...