Por que deve ser transformado diante dos preditores?

8

Ambas as respostas nesses tópicos, uma e duas afirmam que deve ser transformado antes de aplicar qualquer outra transformação aos preditores. De fato, o capítulo sobre transformações de Weisberg concentra-se mais em DV do que em preditores, assim como a página de manual powerTransform () do pacote de carros R.Y

No entanto, sabemos que a normalidade da distribuição de DV não é um requisito no OLS para estimar os coeficientes BLUE e, mesmo quando os resíduos não são estritamente normalmente distribuídos, o OLS ainda é um estimador razoável .

Então, por que a ênfase na transformação de ? Existem algumas razões pelas quais eu acho que é realmente preferível não transformar : primeiro, torna a relação dos IVs mais difícil de ler e, em segundo lugar, na previsão, exige uma retrotradução do valor estimado para a escala original . Dependendo do que você está fazendo isso, pode ser um problema.YYY

Robert Kubrick
fonte
2
Temos modelos lineares generalizados em nome desde 1972 e, em casos particulares, por muito mais tempo. Ou seja, o uso de funções de link apropriadas pode oferecer todas as vantagens de usar uma escala não linear com todas as vantagens de obter previsões na escala dos dados originais. Por que isso não é mais conhecido e praticado? Respostas mais longas são necessárias e serão fornecidas, mas a análise de relacionamentos não lineares com ferramentas lineares aplicadas a dados não transformados raramente funciona bem.
Nick Cox
1
+1 para @Nick. Além disso, analisar relações com quase qualquer procedimento padrão (ou seja, com base em distribuições quase-normais) em circunstâncias em que a distribuição de erros é fortemente distorcida também é geralmente complicada e insatisfatória. As reexpressões não lineares na verdade alcançam três coisas (e geralmente fazem todas simultaneamente): simetrizam distribuições de resíduos, criam homoscedasticidade e linearizam relacionamentos.
whuber

Respostas:

5

A transformação de X não afeta a forma da distribuição condicional, nem a heterocedasticidade; portanto, a transformação de X realmente serve apenas para lidar com relacionamentos não lineares. (Se você estiver ajustando modelos aditivos, isso pode ajudar a eliminar a interação, mas mesmo assim é melhor deixar para transformar Y)

Um exemplo em que transformar apenas X faz sentido:
insira a descrição da imagem aqui

Se esse é o problema principal - falta de ajuste na média condicional -, transformar X pode fazer sentido, mas se você estiver transformando devido à forma do Y condicional ou devido à heterocedasticidade, se estiver resolvendo isso por transformação ( não necessariamente a melhor opção, mas estamos tomando a transformação como um dado para esta pergunta), então você deve transformar Y de alguma forma para alterá-la.

Considere, por exemplo, um modelo em que a variação condicional é proporcional à média:

Um exemplo em que transformar apenas X não pode resolver os problemas:
insira a descrição da imagem aqui

Mover valores no eixo x não mudará o fato de que a propagação é maior para valores à direita do que valores à esquerda. Se você deseja corrigir essa variação de variação por transformação, é necessário reduzir os valores Y altos e esticar os valores Y baixos.

Agora, se você está pensando em transformar Y, isso mudará a forma do relacionamento entre resposta e preditores ... então, com frequência, você também espera transformar X se quiser um modelo linear (se era linear antes de transformar, não será depois). Às vezes (como no segundo gráfico acima), uma transformação Y = tornará o relacionamento mais linear ao mesmo tempo - mas nem sempre é o caso.

Se você está transformando X e Y, deseja fazer Y primeiro, por causa dessa mudança na forma do relacionamento entre Y e X - geralmente você precisa ver como são os relacionamentos depois de se transformar. A transformação subsequente de X terá como objetivo obter linearidade do relacionamento.

Portanto, em geral, se você está se transformando, muitas vezes precisa transformar Y e, se estiver fazendo isso, quase sempre deseja fazê-lo primeiro.

Glen_b -Reinstate Monica
fonte
Se tivermos os resíduos terão uma crescente variação de regressão contra (não transformada). É claro que a transformação de tem um impacto na heterocedasticidade dos resíduos. X 1 XY=β0+β1X5+ϵX1X
Robert Kubrick
1
@RobertKubrick não é relativo à sua média local. Veja minha postagem editada.
Glen_b -Reinstate Monica
Eu ainda não vejo isso. Eu acredito que as mudanças de variância são realmente por causa de , e não pela distribuição condicional deAliás, o gráfico que você postou é para o não transformado . Eu sei que você fez isso para mostrar a não linearidade do relacionamento, mas é um pouco confuso no contexto da sua resposta. Y XϵYX
Robert Kubrick
Var(ϵ)=Var(Y|X) . Você parece fazer distinção entre as duas variações, mas elas não são distintas.
Glen_b -Reinstala Monica
1
Ele altera apenas a média condicional. Esse é o ponto que está sendo feito na minha resposta.
Glen_b -Reinstate Monica
2

Transformar Y inicialmente é uma abordagem anacrônica para análise de dados. Nossos tataravós fizeram isso, então por que não deveríamos? Muitas razões e sua postagem refletindo que as suposições gaussianas se baseiam apenas nos erros de um modelo, NÃO da série Y, é imprescindível.

IrishStat
fonte
4
Eu concordo com a primeira frase mais do que discordo; no entanto, a resposta é mais do que um pouco simplificada. Exemplos como pH ou decibéis mostram que a medição científica já está em uma escala transformada e por boas razões. Muitos economistas usam rotineiramente a renda do setor, e não a renda, como variável de resposta, e isso se encaixa na maneira como as pessoas comuns tomam muitas decisões (por exemplo, em termos de porcentagem de pensamento). (A história aqui é que eu acho discutível também, transformações não eram especialmente comum antes de meados do século 20.)
Nick Cox
@ Nick, eu estava falando superficialmente sobre meus antepassados. As transformações começaram a aparecer em meados dos anos cinquenta .....
IrishStat
3
Exagero de língua na bochecha e colorido que compro prontamente, mas mesmo assim declarações precisas devem estar corretas. A literatura sobre o lognormal começou no século 19, assim como o papel gráfico logarítmico. As transformações foram objeto de várias revisões antes da década de 1950, por exemplo, o artigo de Bartlett em Biometrics 1947, portanto a literatura é mais antiga. Isso é consistente, eu acho, com minha afirmação anterior de que eles não são "especialmente comuns".
Nick Cox
3
Os @Nick Scientists estavam usando transformações muito antes de 1947, porque são muito naturais. Um bom exemplo é a derivação de Rydberg de sua fórmula para o espectro de hidrogênio , obtida na década de 1880, escolhendo transformações não-lineares adequadas das variáveis. Alguém poderia apelar para o trabalho de Fechner em psicofísica c. 1860 também. Essa prática é tão eficaz e importante nas ciências que não se pode levar a sério a primeira afirmação nesta resposta que é "anacrônica".
whuber
3
@whuber Concordamos, em essência. Existe um espectro (trocadilhos) do uso de transformações nas ciências físicas e outras, freqüentemente surgindo como um meio ou como conseqüência da descoberta de relacionamentos não lineares, para o uso deliberado de transformações de dados brutos, conforme recomendado por (alguns) estatísticos. Eu não gostaria de traçar uma linha entre os dois, pois isso seria inútil e não ajudaria.
Nick Cox