Quando fazemos várias regressões e dizemos que estamos olhando para a mudança média na variável para uma mudança na variável , mantendo todas as outras variáveis constantes, em quais valores estamos mantendo as outras variáveis constantes? A média deles? Zero? Qualquer valor?x
Estou inclinado a pensar que tem algum valor; apenas procurando esclarecimentos. Se alguém tivesse uma prova, isso seria ótimo também.
multiple-regression
interpretation
least-squares
regression-coefficients
controlling-for-a-variable
EconStats
fonte
fonte
Respostas:
Você está certo. Tecnicamente, é qualquer valor . No entanto, quando eu ensinar isso eu costumo dizer às pessoas que você está recebendo o efeito de uma mudança uma unidade emXj quando todas as outras variáveis são realizadas em seus respectivos meios. Eu acredito que essa é uma maneira comum de explicar que não é específica para mim.
Costumo mencionar que, se você não tiver nenhuma interação, será o efeito de uma alteração de uma unidade em X j , independentemente dos valores de suas outras variáveis. Mas eu gosto de começar com a formulação média. O motivo é que existem dois efeitos da inclusão de várias variáveis em um modelo de regressão. Primeiro, você obtém o efeito de X j controlando as outras variáveis (veja minha resposta aqui ). A segunda é que a presença de outras variáveis (normalmente) reduz a variação residual do modelo, tornando suas variáveis (incluindo X jβj Xj Xj Xj ) 'Mais significante'. É difícil para as pessoas entenderem como isso funciona se as outras variáveis tiverem valores que estão em todo lugar. Parece que isso aumentaria a variabilidade de alguma forma. Se você pensar em ajustar cada ponto de dados para cima ou para baixo para o valor de cada outra variável até que todas as demais variáveis tenham sido movidas para suas respectivas médias, é mais fácil ver que a variabilidade residual foi reduzida. X
Não interajo até uma ou duas aulas depois de apresentar os conceitos básicos da regressão múltipla. No entanto, quando chego a eles, volto a este material. O acima se aplica quando não há interações. Quando há interações, é mais complicado. Nesse caso, a variável de interação [s] está sendo mantida constante (muito especificamente) em e em nenhum outro valor.0
Se você quiser ver como isso ocorre algebricamente, é bastante direto. Podemos começar com o caso de não interação. Vamos determinar a mudança no Y quando todas as outras variáveis são constantes realizada em seus respectivos meios. Sem perda de generalidade, vamos dizer que existem três X variáveis e estamos interessados em compreender como a mudança em Y está associada com uma mudança uma unidade em X 3 , segurando X 1 e X 2 constantes em seus respectivos meios:Y^ X Y^ X3 X1 X2
Agora é óbvio que poderíamos colocar qualquer valor para e X 2 nas duas primeiras equações, desde que atribuíssemos o mesmo valor para X 1 ( X 2 ) em ambas. Ou seja, enquanto mantivermos X 1 e X 2 constantes .X1 X2 X1 X2 X1 X2
Por outro lado, não funciona dessa maneira se você tiver uma interação. Aqui mostro o caso em que há um termo de interação :X1X3
Nesse caso, não é possível manter tudo o mais constante. Como o termo de interação é uma função de e X 3 , não é possível alterar X 3 sem que o termo de interação também seja alterado. Assim, p 3 é igual à variação em Y associado com uma mudança uma unidade em X 3 somente quando a variável de interagir ( X 1 ) é mantida a 0 em vez de ˉ X 1 (ou qualquer outro valor, mas 0 ), em cujo caso o último termo na equação inferior desaparece.X1 X3 X3 β^3 Y^ X3 X1 0 X¯1 0
Nesta discussão, concentrei-me nas interações, mas, de maneira mais geral, o problema é quando existe uma variável que é função de outra, de forma que não é possível alterar o valor da primeira sem alterar o valor respectivo da outra variável. . Em tais casos, o significado de β j torna-se mais complicada. Por exemplo, se tinha um modelo com X j e X 2 j , então β j é o derivado d Yβ^j Xj X2j β^j mantendo todo o resto igual e mantendoXj=0(veja minha respostaaqui). Outras formulações ainda mais complicadas também são possíveis. dYdXj Xj=0
fonte
A matemática é simples, basta considerar a diferença entre dois modelos com uma das variáveis x alteradas por 1 e você verá que não importa quais são as outras variáveis (dado que não há interações, polinômios ou outros termos complicadores).
Um exemplo:
fonte
Assim como uma tangente interessante, aqui está um exemplo: SejaX1∼ N( 0 , σ21) X2= X21+ N( 0 , σ22) X1 X2
fonte