Existe um princípio geral sobre se alguém deve calcular a correlação de pearson para duas variáveis aleatórias X e Y antes de realizar a transformação logarítmica ou depois? Existe um procedimento para testar o que é mais apropriado? Eles produzem valores semelhantes, mas diferentes, pois a transformação de log é não linear. Depende se X ou Y estão mais próximos da normalidade após o log? Se sim, por que isso importa? E isso significa que se deve fazer um teste de normalidade em X e Y versus log (X) e log (Y) e, com base nisso, decidir se pearson (x, y) é mais apropriado que pearson (log (x), log ( y))?
regression
correlation
logarithm
pearson-r
user9097
fonte
fonte
Respostas:
fonte
A correlação (pearson) mede uma relação linear entre duas variáveis contínuas. Não existe essa opção para (X, Y) ou (log X, log Y). O gráfico de dispersão das variáveis pode ser usado para entender o relacionamento.
O link a seguir pode responder sobre a questão da normalidade. ligação
fonte
A correlação de Pearson é para testes paramétricos e é mais poderosa que o teste não parametírico. Assim, optamos por usar a transformação antes de qualquer procedimento não paramétrico. Transforme seus dados e obtenha correlação de pessoas. É isso aí.
fonte