Estou fazendo uma regressão linear com uma variável dependente transformada. A transformação a seguir foi feita para que a suposição de normalidade dos resíduos se mantivesse. A variável dependente não transformada foi inclinada negativamente e a transformação a seguir tornou-a quase normal:
onde é a variável dependente na escala original.
Eu acho que faz sentido usar alguma transformação nos coeficientes para voltar à escala original. Usando a seguinte equação de regressão,
e fixando , temos
E finalmente,
Usando a mesma lógica, descobri
Agora, as coisas funcionam muito bem para um modelo com 1 ou 2 preditores; os coeficientes transformados de volta se assemelham aos originais, só que agora posso confiar nos erros padrão. O problema ocorre ao incluir um termo de interação, como
Então, as transformações anteriores dos s não são tão próximas das da escala original, e não sei por que isso acontece. Também não tenho certeza se a fórmula encontrada para a transformação reversa de um coeficiente beta é utilizável como é para o terceiro (para o termo de interação). Antes de entrar em álgebra louca, pensei em pedir conselhos ...
fonte
Respostas:
Um problema é que você escreveu
Esse é um modelo determinístico simples (isto é, não aleatório). Nesse caso, você pode transformar os coeficientes na escala original, pois é apenas uma questão de álgebra simples. Mas, na regressão usual, você só tem ; você deixou o termo do erro fora do seu modelo. Se a transformação de volta para for não linear, você pode ter um problema, já que , em geral. Eu acho que isso pode ter a ver com a discrepância que você está vendo.E(Y|X)=α+β⋅X Y Yorig E(f(X))≠f(E(X))
Editar: observe que, se a transformação for linear, você poderá voltar a transformar para obter estimativas dos coeficientes na escala original, pois a expectativa é linear.
fonte
Saúdo seus esforços aqui, mas você está latindo na árvore errada. Você não volta a transformar betas. Seu modelo é válido no mundo dos dados transformados. Se você quiser fazer uma previsão, por exemplo, você transforma novamente , mas é isso. Obviamente, você também pode obter um intervalo de previsão calculando os valores limite alto e baixo e depois transformá-los também, mas em nenhum caso você transforma novamente os betas.y^i
fonte
ASK QUESTION
); haverá mais recursos para responder, você receberá a atenção de mais CVers e as informações estarão mais acessíveis para a posteridade.