Como usar o teste de Hausman para discriminação de gênero?

8

Estou tentando estimar a diferença salarial entre homens e mulheres em uma grande empresa sueca para verificar se há discriminação de gênero. O teste de Hausman rejeita o nulo de que os efeitos fixos individuais são aleatórios e, portanto, não posso confiar no OLS agrupado ou nos efeitos aleatórios. O problema é que não consigo manter minha manequim feminina em uma regressão de efeitos fixos porque ela não varia ao longo do tempo.

Foi-me sugerido o uso de um teste de Hausman para testar a discriminação, mas realmente não consigo ver como isso deve ser usado para encontrar uma diferença nos ganhos entre homens e mulheres. Eu esperava que talvez alguém aqui entendesse um pouco melhor esse conselho. Se sim, você poderia, por favor, esclarecer isso para mim?

Kerst
fonte

Respostas:

11

Entendo o raciocínio por trás deste conselho, mas i) essa pessoa deveria ter explicado melhor para você e ii) eles também deveriam ter mencionado as suposições restritivas subjacentes a essa idéia.

No teste de Hausman, você geralmente pergunta se existe uma diferença entre um modelo consistente, mas ineficiente, e um modelo potencial inconsistente, que é mais eficiente. No caso padrão em que você compara efeitos fixos e aleatórios, o estimador de efeitos fixos é consistente, independentemente de os efeitos individuais estarem correlacionados com outras variáveis ​​explicativas, mas é menos eficiente que o estimador de efeitos aleatórios, que é consistente apenas para efeitos fixos não correlacionados com o Variáveis ​​explicativas.

Qualquer um dos dois grupos (masculino ou feminino) terá menos observações. A priori, acho que esse é o grupo feminino. Portanto, se você executar a mesma especificação de regressão que é salário, são as mesmas variáveis ​​de explante de variação de tempo, são os efeitos fixos individuais e é um erro estocástico, então uma diferença entre os modelos masculino e feminino implicaria que existe um tratamento diferente para homens e mulheres em termos de salários. As estatísticas de teste nesse caso seriam

yit=α+Xitβ+ci+ϵit
yXciϵ
H=(βfemβmale)(Var(βfem)Var(βmale))(βfemβmale)

No entanto, e este é um ponto importante, todo esse raciocínio só é verdadeiro se os dois modelos forem especificados corretamente. Deve ser fácil apresentar variáveis ​​omitidas específicas de gênero, que variam de tempo e afetam os salários, por exemplo, nascimento de crianças. Isso imediatamente quebra a suposição principal dessa idéia, para que eu tenha cuidado com isso.

Andy
fonte