Are

12

Meu colega deseja analisar alguns dados após transformar a variável de resposta, elevando-a ao poder de (isto é,Y0,125).18y0.125

Estou desconfortável com isso, mas estou tentando entender o porquê. Não consigo pensar em nenhuma lógica mecanicista para essa transformação. Também nunca vi isso antes, e me preocupo com o fato de talvez inflar taxas de erro do tipo I ou algo assim - mas não tenho nada para apoiar essas preocupações!

Além disso, meu colega descobre que esses modelos transformados superam os modelos não transformados em uma comparação da AIC. Isso, por si só, justifica seu uso?

AndrewMacDonald
fonte
9
Apenas para informação, parece um monte como log ( y ) para muitas gamas de y . A transformação do log geralmente é justificada em muitos casos (mas também é frequentemente usada em casos injustificados). y1/8log(y)y
Cliff AB
2
Esta é uma discussão relacionada
user603
5
Você não pode comparar significativamente os AICs entre modelos com variáveis ​​dependentes transformadas. (Transformar a variável independente é bom.)
Stephan Kolassa
5
y=(xp1)/pp
3
Este é um pequeno riff na ideia de que essa transformação pode substituir os logaritmos se ocorrerem zeros. Um link logarítmico para modelos lineares generalizados diz que as respostas médias variam exponencialmente, mas não assume que todos os seus valores sejam positivos. Por isso, tolera alguns zeros nos dados. Aproximadamente, a implicação é que eles deveriam ou seriam positivos se pudessem: por exemplo, zeros relatados (zero amostras na amostra, zero concentrações de acordo com a máquina) às vezes significam não detectados. Apesar de seu nome maravilhoso, Box-Cox parece exagerado sempre que há um vínculo natural nos GLMs.
Nick Cox

Respostas:

10

É prática comum aplicar transformações de poder (Tukey, Box-Cox) com valores arbitrários na resposta. A partir dessa perspectiva, não vejo nenhuma preocupação em relação ao seu valor de 1/8 - se essa transformação fornecer bons resíduos, vá em frente.

É claro que qualquer transformação altera a relação funcional em que você se encaixa, e pode ser que 1/8 não faça sentido mecanicamente, mas isso não seria uma preocupação para mim quando o objetivo não é extrapolar ou ajustar parâmetros de um corpo físico. lei, mas para obter um valor-p adequado no sinal do efeito (eu argumentaria que é o caso de uso normal em uma regressão). Para esse propósito, sua única preocupação é que a função se ajuste aos dados no domínio dos valores preditores (média e variação residual wrt), e isso é fácil de verificar.

Se você não tiver certeza sobre o melhor valor para a transformação de energia e deseja comparar entre opções diferentes, não deve comparar diretamente os valores de AIC / probabilidade, porque a transformação de energia altera a escala da resposta. Felizmente, verifica-se que é relativamente simples calcular uma correção para a transformação, de modo que diferentes transformações possam ser comparadas por meio de sua probabilidade (corrigida) (veja, por exemplo, aqui ).

No R, isso é implementado no MASS :: boxcox - essa é uma maneira conveniente de escolher o valor certo para a energia.

Florian Hartig
fonte