Correlação positiva e sinal do coeficiente de regressão negativo

12

É possível obter uma correlação positiva entre um regressor e uma resposta ( +0,43) e, posteriormente, obter um coeficiente negativo no modelo de regressão ajustado para esse regressor?

Não estou falando de mudanças no sinal do regressor entre alguns modelos. O sinal do coeficiente sempre permanece.

As demais variáveis ​​do modelo ajustado poderiam influenciar a alteração do sinal?

Javier Bermejo
fonte
3
Você vai encontrar uma pergunta e respostas semelhante aqui: stats.stackexchange.com/questions/33888/...
JDav

Respostas:

16

@Henry e @JDav estão apontando você na direção certa (+1 para cada). No entanto, sou muito visual e me ajuda a entender como isso funciona. A esse respeito, aqui está um gráfico rápido em que a primeira variável é confundida com a associação ao grupo. Se os grupos forem ignorados, o coeficiente de correlação é positivo (como pode ser visto na figura), mas em uma regressão múltipla,βx1=-1, embora com interceptações diferentes para os três grupos. insira a descrição da imagem aqui
Como alimento adicional para o pensamento, quando todas as variáveis ​​são categóricas (em vez de contínuas, como neste caso), o fenômeno de reverter a aparente relação com a inclusão de outras variáveis ​​é conhecido como paradoxo de Simpson. Como, em última análise, é bastante semelhante, também pode ajudar a ler sobre isso. É discutido no CV aqui .

Repor a Monica
fonte
1
FWIW, eu tenho um tratamento mais completo essencialmente do mesmo problema aqui: Existe uma diferença entre 'controlar' e 'ignorar' outras variáveis ​​na regressão múltipla?
gung - Restabelece Monica
10

Se o regressor correlacionado positivamente é o único regressor em um modelo linear, seu coeficiente deve ser positivo.

Se houver vários regressores e eles não forem independentes, você poderá ver o efeito que está perguntando. Leia sobre confusão para obter algumas explicações

Henry
fonte