Estou fazendo regressão linear em dados de composição usando a transformação de razão de log com dados do censo. Os IVs são composicionais (porcentagens que somam 100). O DV é não composicional e contínuo.
Os resultados alr e clr são mais facilmente interpretados. Todos eles produzem a mesma medida de ajuste. Estou inclinado a ir com alr (ou clr). Aitchison caracteriza ilr como a abordagem da "matemática pura", mas meu público não é estatístico ou matemático.
Se meu objetivo é apenas comunicar informações a partir da análise, por que devo adotar a abordagem muito mais difícil de interpretar?
Eu li montes de pesquisas de Aitchison, Juan Jose Egozcue e Vera Pawlosky-Glahn, mas não querendo debater.
fonte
m - 1
?Há um problema com a transformação clr (). Ele faz preservar as mesmas variáveis quantidade depois de transformar os dados, mas em caso de clr (), obtém um conjunto de dados singulares (na verdade você tem uma matriz de covariância singular):
y1 + ... yD = 0
. E como você deve saber, algumas análises estatísticas não podem ser executadas em dados singulares. A transformação ilr () reduzirá o número de sua variável, digamos que você tenha espaço D-dimensional, mas depois de ilr () você terminará com D-1. Como resultado, seus dados transformados nada mais são do que proporções. Recomendo a leitura deste artigo aqui: http://is.muni.cz/do/rect/habilitace/1431/Hron/habilitace/15_Filzmoser_et_al__2010_.pdffonte
Eu iria com o ALR, pois faz mais sentido. Você usa um componente como linha de base ou referência e depois vê o que os outros fazem em relação a esse.
fonte