Retrotransformação dos coeficientes de regressão

17

Estou fazendo uma regressão linear com uma variável dependente transformada. A transformação a seguir foi feita para que a suposição de normalidade dos resíduos se mantivesse. A variável dependente não transformada foi inclinada negativamente e a transformação a seguir tornou-a quase normal:

Y=50Yorig

onde é a variável dependente na escala original.Yorig

Eu acho que faz sentido usar alguma transformação nos coeficientes para voltar à escala original. Usando a seguinte equação de regressão,β

Y=50Yorig=α+βX

e fixando , temosX=0

α=50Yorig=50αorig

E finalmente,

αorig=50α2

Usando a mesma lógica, descobri

βorig=α (α2β)+β2+αorig50

Agora, as coisas funcionam muito bem para um modelo com 1 ou 2 preditores; os coeficientes transformados de volta se assemelham aos originais, só que agora posso confiar nos erros padrão. O problema ocorre ao incluir um termo de interação, como

Y=α+X1βX1+X2βX2+X1X2βX1X2

Então, as transformações anteriores dos β s não são tão próximas das da escala original, e não sei por que isso acontece. Também não tenho certeza se a fórmula encontrada para a transformação reversa de um coeficiente beta é utilizável como é para o terceiro β (para o termo de interação). Antes de entrar em álgebra louca, pensei em pedir conselhos ...

Dominic Comtois
fonte
Como você define e ? β o r i gαorigβorig
mark999
À medida que o valor de alfa e beta nas escalas originais
Dominic Comtois
1
Mas o que isso significa?
mark999
Eu arriscaria algo como: as estimativas que receberíamos eram os dados originais adequados para a regressão linear.
Dominic Comtois
2
Para mim, isso parece um conceito sem sentido. Eu concordo com a resposta de Gung.
mark999

Respostas:

19

Um problema é que você escreveu

Y=α+βX

Esse é um modelo determinístico simples (isto é, não aleatório). Nesse caso, você pode transformar os coeficientes na escala original, pois é apenas uma questão de álgebra simples. Mas, na regressão usual, você só tem ; você deixou o termo do erro fora do seu modelo. Se a transformação de volta para for não linear, você pode ter um problema, já que , em geral. Eu acho que isso pode ter a ver com a discrepância que você está vendo.E(Y|X)=α+βXYYorigE(f(X))f(E(X))

Editar: observe que, se a transformação for linear, você poderá voltar a transformar para obter estimativas dos coeficientes na escala original, pois a expectativa é linear.

Macro
fonte
4
+1 para explicar por que não podemos transformar os betas de volta.
gung - Restabelece Monica
15

Saúdo seus esforços aqui, mas você está latindo na árvore errada. Você não volta a transformar betas. Seu modelo é válido no mundo dos dados transformados. Se você quiser fazer uma previsão, por exemplo, você transforma novamente , mas é isso. Obviamente, você também pode obter um intervalo de previsão calculando os valores limite alto e baixo e depois transformá-los também, mas em nenhum caso você transforma novamente os betas. y^i

- Reinstate Monica
fonte
1
O que considerar do fato de que os coeficientes transformados de volta se aproximam muito dos obtidos ao modelar a variável não transformada? Isso não permite alguma inferência na escala original?
Dominic Comtois
2
Eu não sei exatamente. Pode depender de várias coisas. Meu primeiro palpite é que você está tendo sorte com seu primeiro par de betas, mas sua sorte acaba. Eu tenho que concordar com @ / mark999 que "as estimativas que obteríamos eram os dados originais adequados para a regressão linear" na verdade não fazem nenhum sentido; Eu gostaria que isso acontecesse e isso parece meio que à primeira vista, mas infelizmente não. E não licencia nenhuma dedução na escala original.
gung - Restabelece Monica
1
@gung para transformações não lineares (por exemplo, box cox): eu posso transformar valores ajustados e intervalos de previsão, mas não consigo transformar betas nem intervalos de coeficiente para os betas. Existe alguma limitação adicional que eu deveria estar ciente? Aliás, este é um tópico muito interessante. Onde posso entender melhor?
Mugen
2
@Mugen, é difícil dizer o que mais você deve estar ciente. Talvez você deva ter em mente que a transformação dorsal do y-hat fornece a mediana condicional, enquanto que o y-hat não transformado nas costas (mancha) é a média condicional. Fora isso, esse material deve ser abordado em um bom livro de regressão.
gung - Restabelece Monica
3
@mugen, de nada. Sinta-se à vontade para fazer mais perguntas através dos mecanismos normais (clicar ASK QUESTION); haverá mais recursos para responder, você receberá a atenção de mais CVers e as informações estarão mais acessíveis para a posteridade.
gung - Restabelece Monica