Em Descobrindo estatísticas usando o SPSS 4ª edição, por Andy Field, foi recomendável incluir o termo de interação entre a variável independente e sua variável de transformação de logaritmo natural correspondente para verificar a violação da suposição de linearidade. Qual é a teoria estatística por trás disso?
Esta é uma citação do livro:
Essa suposição pode ser testada observando se o termo de interação entre o preditor e sua transformação logarítmica é significativo (Hosmer & Lemeshow, 1989).
Também descobri recentemente que essa transformação é chamada transformação Box-Tidwell.
regression
logistic
assumptions
tatami
fonte
fonte
Respostas:
Box e Tidwell (1962) [1] apresentaram uma abordagem geral para estimar transformações dos preditores individuais (IVs), e trabalham com o caso específico de estimar transformações de potência das variáveis preditivas (incluindo essa potência 0, que - com escala apropriada - corresponde a receber registros como um caso limitante).
Nesse caso específico de transformações de poder, verifica-se que há uma conexão com a regressão em .Xjlog(Xj)
Portanto, se você tiver uma não-linearidade do tipo em que a relação verdadeira (condicional) entre e é linear em , ela poderá ser usada para verificar se há ou para estimar valores .Y Xj Xαjj αj≠1 α
Especificamente, ao regressar em e o coeficiente do segundo termo dividido pelo do primeiro é uma estimativa aproximada de . (Essa estimativa pode ser iterada para convergência.)Xj Xjlog(Xj) αj−1
Se esse estimado for próximo de 1, haverá pouca indicação de necessidade de transformação.αj
Observe que, como os dois termos do produto são funções de , este é simplesmente um transformado, de modo que eu não chamaria isso de interação; é apenas um preditor transformado. (De fato, mesmo que eu estivesse de alguma forma tentado a fazê-lo, como não é incluído como um preditor, ainda assim não tenderia a descrever esse segundo termo como uma interação.)Xjlog(Xj) Xj Xj log(Xj)
[1]: Box, GEP e Tidwell, PW (1962), "Transformação das variáveis independentes". Technometrics 4 , 531-550.
fonte