Começo com minha regressão OLS:
onde D é uma variável dummy, as estimativas tornam-se diferentes de zero com um baixo valor de p. Em seguida, pré-formao um teste de Ramsey RESET e descobri que tenho alguma classificação equivocada da equação, portanto incluo ao quadrado x:
- O que o termo ao quadrado explica? (Aumento não linear em Y?)
- Ao fazer isso, minha estimativa D não varia mais de zero, com um alto valor de p. Como interpreto o termo quadrado na minha equação (em geral)?
Editar: Melhorando a pergunta.
Respostas:
Bem, primeiro, a variável dummy é interpretada como uma mudança na interceptação. Ou seja, seu coeficiente fornece a diferença na interceptação quando D = 1 , ou seja, quando D = 1 , a interceptação é β 0 + β 3 . Essa interpretação não muda ao adicionar o quadrado x 1 .β3 D = 1 D = 1 β0 0+ β3 x1
Agora, o ponto de adicionar um quadrado à série é que você assume que o relacionamento se desvanece em um determinado ponto. Olhando para sua segunda equação
Tomando o derivado wrt obtém-sex1
Resolver esta equação fornece o ponto de virada do relacionamento. Como o usuário 1493368 explicou, isso realmente reflete uma forma inversa de U se e vice-versa. Veja o seguinte exemplo:β1< 0
A derivada wrt éx1
A resolução de fornece a vocêx1
Esse é o ponto em que o relacionamento tem seu ponto de virada. Você pode dar uma olhada na saída do Wolfram-Alpha para a função acima, para obter uma visualização do seu problema.
Lembre-se, ao interpretar o efeito ceteris paribus de uma mudança em em y , você deve observar a equação:x1 y
Ou seja, você não pode interpretar isoladamente, depois de adicionar o regressor ao quadrado x 2 1 !β1 x21
fonte
Um bom exemplo de incluir quadrado de variável vem da economia do trabalho. Se você assume
y
como salário (ou log de salário) ex
como idade, incluirx^2
significa que está testando a relação quadrática entre uma idade e um salário. O salário aumenta com a idade, à medida que as pessoas se tornam mais experientes, mas com a idade mais alta, o salário começa a aumentar a uma taxa decrescente (as pessoas ficam mais velhas e não serão tão saudáveis para trabalhar como antes) e, em algum momento, o salário não aumenta ( atinge o nível salarial ideal) e depois começa a cair (eles se aposentam e seus ganhos começam a diminuir). Portanto, a relação entre salário e idade é invertida em forma de U (efeito do ciclo de vida). Em geral, para o exemplo mencionado aqui,age
espera-se que o coeficiente seja positivo eage^2
negativo. O ponto aqui é que deve haver base teórica / justificativa empírica para incluir o quadrado da variável. A variável dummy, aqui, pode ser pensada como representando o sexo do trabalhador. Você também pode incluir o termo de interação de gênero e idade para examinar se o diferencial de gênero varia de acordo com a idade.fonte