Estou analisando um conjunto de dados sobre comunidades entre marés. Os dados são cobertura percentual (de algas, cracas, mexilhões etc.) em quadrantes. Estou acostumado a pensar na análise de correspondência (CA) em termos de contagem de espécies e na análise de componentes principais (PCA) como algo mais útil para tendências ambientais lineares (e não espécies). Realmente não tive sorte em descobrir se o PCA ou CA seria o melhor ajuste para a porcentagem de cobertura (não consigo encontrar nenhum documento), e nem tenho certeza de como seria distribuído algo que é limitado a 100% ?
Eu estou familiarizado com a diretriz aproximada de que, se o comprimento do primeiro eixo da análise de correspondência prejudicada (DCA) for maior que 2, você poderá assumir com segurança que a CA deve ser usada. O comprimento do eixo 1 do DCA era de 2,17, o que não acho útil.
fonte
Respostas:
O PCA trabalha nos valores em que a CA trabalha nos valores relativos. Ambos são bons para dados de abundância relativa do tipo que você menciona (com uma ressalva importante, veja mais adiante). Com% de dados, você já tem uma medida relativa, mas ainda haverá diferenças. Pergunte a si mesmo
Se o primeiro, use o PCA. Se o último usar CA. O que quero dizer com as duas perguntas é: você gostaria
ser considerado diferente ou igual?
A
eB
são duas amostras e os valores são a cobertura% de três táxons mostrados. (Este exemplo acabou mal, suponha que exista um terreno descoberto! ;-) O PCA consideraria esses itens muito diferentes por causa da distância euclidiana usada, mas a CA consideraria essas duas amostras como sendo muito semelhantes porque têm o mesmo perfil relativo.A grande ressalva aqui é a natureza composicional fechada dos dados. Se você tem alguns grupos (areia, silte, argila, por exemplo) que somam 1 (100%), nenhuma das abordagens está correta e você pode passar para uma análise mais apropriada por meio do PCA de proporção de log de Aitchison, projetado para composição composicional fechada. dados. (O IIRC para fazer isso é necessário centralizar por linhas e colunas e transformar os dados pelos logs.) Existem outras abordagens também. Se você usar R, então um livro que seria útil é Analisando composicional de dados com R .
fonte