É possível obter uma correlação positiva entre um regressor e uma resposta ( +0,43
) e, posteriormente, obter um coeficiente negativo no modelo de regressão ajustado para esse regressor?
Não estou falando de mudanças no sinal do regressor entre alguns modelos. O sinal do coeficiente sempre permanece.
As demais variáveis do modelo ajustado poderiam influenciar a alteração do sinal?
correlation
multiple-regression
regression-coefficients
Javier Bermejo
fonte
fonte
Respostas:
@Henry e @JDav estão apontando você na direção certa (+1 para cada). No entanto, sou muito visual e me ajuda a entender como isso funciona. A esse respeito, aqui está um gráfico rápido em que a primeira variável é confundida com a associação ao grupo. Se os grupos forem ignorados, o coeficiente de correlação é positivo (como pode ser visto na figura), mas em uma regressão múltipla,βx 1= - 1 , embora com interceptações diferentes para os três grupos.
Como alimento adicional para o pensamento, quando todas as variáveis são categóricas (em vez de contínuas, como neste caso), o fenômeno de reverter a aparente relação com a inclusão de outras variáveis é conhecido como paradoxo de Simpson. Como, em última análise, é bastante semelhante, também pode ajudar a ler sobre isso. É discutido no CV aqui .
fonte
Se o regressor correlacionado positivamente é o único regressor em um modelo linear, seu coeficiente deve ser positivo.
Se houver vários regressores e eles não forem independentes, você poderá ver o efeito que está perguntando. Leia sobre confusão para obter algumas explicações
fonte