Ambas as respostas nesses tópicos, uma e duas afirmam que deve ser transformado antes de aplicar qualquer outra transformação aos preditores. De fato, o capítulo sobre transformações de Weisberg concentra-se mais em DV do que em preditores, assim como a página de manual powerTransform () do pacote de carros R.
No entanto, sabemos que a normalidade da distribuição de DV não é um requisito no OLS para estimar os coeficientes BLUE e, mesmo quando os resíduos não são estritamente normalmente distribuídos, o OLS ainda é um estimador razoável .
Então, por que a ênfase na transformação de ? Existem algumas razões pelas quais eu acho que é realmente preferível não transformar : primeiro, torna a relação dos IVs mais difícil de ler e, em segundo lugar, na previsão, exige uma retrotradução do valor estimado para a escala original . Dependendo do que você está fazendo isso, pode ser um problema.
fonte
Respostas:
A transformação de X não afeta a forma da distribuição condicional, nem a heterocedasticidade; portanto, a transformação de X realmente serve apenas para lidar com relacionamentos não lineares. (Se você estiver ajustando modelos aditivos, isso pode ajudar a eliminar a interação, mas mesmo assim é melhor deixar para transformar Y)
Um exemplo em que transformar apenas X faz sentido:
Se esse é o problema principal - falta de ajuste na média condicional -, transformar X pode fazer sentido, mas se você estiver transformando devido à forma do Y condicional ou devido à heterocedasticidade, se estiver resolvendo isso por transformação ( não necessariamente a melhor opção, mas estamos tomando a transformação como um dado para esta pergunta), então você deve transformar Y de alguma forma para alterá-la.
Considere, por exemplo, um modelo em que a variação condicional é proporcional à média:
Um exemplo em que transformar apenas X não pode resolver os problemas:
Mover valores no eixo x não mudará o fato de que a propagação é maior para valores à direita do que valores à esquerda. Se você deseja corrigir essa variação de variação por transformação, é necessário reduzir os valores Y altos e esticar os valores Y baixos.
Agora, se você está pensando em transformar Y, isso mudará a forma do relacionamento entre resposta e preditores ... então, com frequência, você também espera transformar X se quiser um modelo linear (se era linear antes de transformar, não será depois). Às vezes (como no segundo gráfico acima), uma transformação Y = tornará o relacionamento mais linear ao mesmo tempo - mas nem sempre é o caso.
Se você está transformando X e Y, deseja fazer Y primeiro, por causa dessa mudança na forma do relacionamento entre Y e X - geralmente você precisa ver como são os relacionamentos depois de se transformar. A transformação subsequente de X terá como objetivo obter linearidade do relacionamento.
Portanto, em geral, se você está se transformando, muitas vezes precisa transformar Y e, se estiver fazendo isso, quase sempre deseja fazê-lo primeiro.
fonte
Transformar Y inicialmente é uma abordagem anacrônica para análise de dados. Nossos tataravós fizeram isso, então por que não deveríamos? Muitas razões e sua postagem refletindo que as suposições gaussianas se baseiam apenas nos erros de um modelo, NÃO da série Y, é imprescindível.
fonte