Como manter variáveis ​​invariantes no tempo em um modelo de efeitos fixos

15

Tenho dados sobre os funcionários de uma grande empresa italiana há dez anos e gostaria de ver como a diferença de gênero nos ganhos entre homens e mulheres mudou ao longo do tempo. Para esse propósito, eu OLS agrupado: onde é o log de ganhos por ano, inclui covariáveis ​​que diferem por indivíduo e tempo, são manequins por ano e é igual a um se um trabalhador for do sexo masculino e for zero, caso contrário.

yEut=XEutβ+δmumaeueEu+t=110γtdt+εEut
yXEutdtmalei

Agora, tenho uma preocupação de que algumas das covariáveis ​​possam estar correlacionadas com efeitos fixos não observados. Porém, quando uso o estimador de efeitos fixos (dentro) ou as primeiras diferenças, perco o manequim de gênero porque essa variável não muda com o tempo. Não quero usar o estimador de efeitos aleatórios, porque muitas vezes ouço pessoas dizendo que ele coloca suposições muito irrealistas e improváveis ​​de sustentar.

Existem maneiras de manter o gênero falso e controlar efeitos fixos ao mesmo tempo? Se houver uma maneira, preciso agrupar ou cuidar de outros problemas com os erros dos testes de hipótese na variável sexo?

user42263
fonte

Respostas:

22

Existem algumas maneiras possíveis de manter o gênero falso em uma regressão de efeitos fixos.

No Estimador
Suponha que você tenha um modelo semelhante ao modelo OLS em pool, que é onde as variáveis ​​são como antes. Agora observe que e não podem ser identificados porque o estimador não pode distingui-los do efeito fixo . Como é a interceptação do ano base , é o efeito de gênero nos ganhos nesse período. O que podemos identificar neste caso são

yit=β1+t=210βtdt+γ1(malei)+t=110γt(dtmalei)+Xitθ+ci+ϵit
β1c i β 1 t = 1 γ 1 γ 2 , . . . , γ 10β1+γ1(malei)ciβ1t=1γ1γ2,...,γ10porque eles interagem com seus bonecos de tempo e medem as diferenças nos efeitos parciais de sua variável de gênero em relação ao primeiro período. Isto significa que se você observar um aumento em seu longo do tempo, isso é uma indicação para o aumento da diferença de ganhos entre homens e mulheres.γ2,...,γ10

Estimador de primeira diferença
Se você quiser conhecer o efeito geral da diferença entre homens e mulheres ao longo do tempo, tente o seguinte modelo: onde a variável t = 1 , 2 ,

yit=β1+t=210βtdt+γ(tmalei)+Xitθ+ci+ϵit
é interagido com o manequim de gênero invariante no tempo. Agora, se você tomar primeiras diferenças p 1 e c i caem e você obter y i t - y i ( t - 1 ) = 10 Σ t = 3 β t ( d t - d ( t - 1 ) ) + γ ( t m um l e i -t=1,2,...,10β1ci Então γ ( t m a l e i - [ ( t - 1 ) m a
yityi(t1)=t=310βt(dtd(t1))+γ(tmalei[(t1)malei])+(XitXi(t1))θ+ϵitϵi(t1)
e você pode identificar a diferença de gênero nos lucros y . Portanto, a equação de regressão final será: Δ y i t = 10 t = 3 β t Δ d t + γ (γ(tmalei[(t1)malei])=γ[(t(t1))malei]=γ(malei)γ e você obter o seu efeito de interesse. O bom é que isso é facilmente implementado em qualquer software estatístico, mas você perde um período de tempo.
Δyit=t=310βtΔdt+γ(malei)+ΔXitθ+Δϵit


ci1cEu2

y~it=X~1it+X~2it+γ(male~i2)+c~i+ϵ~it
X~1it=X1itθ^iX¯1iθ^iX¯1i2ciX~2itX2itX¯2iX¯1i

Tudo isso pode parecer um pouco complicado, mas existem pacotes enlatados para esse estimador. Por exemplo, no Stata, o comando correspondente é xthtaylor. Para mais informações sobre esse método, leia Cameron e Trivedi (2009) "Microeconometrics Using Stata". Caso contrário, você pode apenas seguir os dois métodos anteriores, que são um pouco mais fáceis.

Inferência
Para seus testes de hipótese, não há muito que precise ser considerado além do que você precisaria fazer de qualquer maneira em uma regressão de efeitos fixos. Você precisa cuidar da correlação automática nos erros, por exemplo, agrupando na variável de ID individual. Isso permite uma estrutura de correlação arbitrária entre clusters (indivíduos) que lida com autocorrelação. Para uma referência, veja novamente Cameron e Trivedi (2009).

Andy
fonte
4

Outra maneira potencial de manter o manequim de gênero é a abordagem de Mundlak (1978) para um modelo de efeito fixo com variáveis ​​invariantes no tempo. A abordagem de Mundlak postularia que o efeito de gênero pode ser projetado nas médias de grupo das variáveis ​​variáveis ​​no tempo.

Mundlak, Y. 1978: Sobre o agrupamento de séries temporais e dados de seção transversal. Econometrica 46: 69-85.

emeryville
fonte
2

Outro método é estimar os coeficientes invariantes no tempo em uma equação do segundo estágio, usando o erro médio como variável dependente.

βγtu^it

u^ityitXitβ^

u¯i

u¯it=1Tu^iT=yit¯x¯iβ^

Agora, considere a seguinte equação do segundo estágio:

u¯i=δmalei+ci

ciδT


u¯i

u¯i=x¯iβx¯iβ^+δmalei+ci+t=1TϵitT

A expectativa deste estimador é:

E(u¯i)=x¯iβx¯iE(β^)+δmalei+E(ci)+t=1TE(ϵit)T

β^βE(ϵit)=0

E(u¯i)=δmalei+E(ci)

Ou seja, nosso preditor é um estimador imparcial dos componentes invariantes no tempo do modelo.

Em relação à consistência, o limite de probabilidade desse preditor é:

plimTu¯i=plimT(x¯iβ)plimT(x¯iβ^)+plimTδmalei+plimTci+plimT(t=1TϵitT)

Again, given FE assumptions, β^ is a consistent estimator of β, and the error term converges to its mean, which is zero. Therefore:

plimTu¯i=δmalei+ci

Novamente, nosso preditor é um estimador consistente dos componentes invariantes no tempo do modelo.

luchonacho
fonte
1

O dispositivo Chamberlain Mundlak é uma ferramenta perfeita para isso. É geralmente chamado de modelo de efeitos aleatórios correlacionados, porque utiliza o modelo de efeito aleatório para estimar implicitamente efeitos fixos para variáveis ​​variantes no tempo, além de estimar os efeitos aleatórios para variáveis ​​invariantes no tempo.

No entanto, em softwares estatísticos, você o implementa como modelo de efeito aleatório, mas é necessário adicionar as médias de covariáveis ​​variantes de tempo.

Martin Paul
fonte