Mínimos quadrados probit de dois estágios (2SLS)

12

Disseram-me que é possível executar uma regressão IV de dois estágios em que o primeiro estágio é um probit e o segundo estágio é um OLS. É possível usar 2SLS se o primeiro estágio for um probit, mas o segundo estágio for um modelo probit / poisson?

user3543169
fonte

Respostas:

18

O que lhe foi proposto às vezes é chamado de regressão proibida e, em geral, você não estimará consistentemente a relação de interesse. Regressões proibidas produzem estimativas consistentes apenas sob premissas muito restritivas que raramente são válidas na prática (ver, por exemplo, Wooldridge (2010) "Análise Econométrica de Seção Transversal e Dados de Painel", p. 265-268).

O problema é que nem o operador de expectativas condicionais nem a projeção linear realizam funções não lineares. Por esse motivo, apenas uma regressão OLS no primeiro estágio é garantida para produzir valores ajustados que não estão correlacionados com os resíduos. Uma prova disso pode ser encontrada em Greene (2008) "Econometric Analysis" ou, se você quiser uma prova mais detalhada (mas também mais técnica), poderá dar uma olhada nas notas de Jean-Louis Arcand na p. 47 a 52.

Pela mesma razão que na regressão proibida, esse procedimento aparentemente óbvio em duas etapas de imitar 2SLS com probit não produzirá estimativas consistentes. Isso ocorre novamente porque as expectativas e as projeções lineares não são transferidas por funções não lineares. Wooldridge (2010) na seção 15.7.3 na página 594 fornece uma explicação detalhada para isso. Ele também explica o procedimento adequado para estimar modelos probit com uma variável endógena binária. A abordagem correta é usar a máxima probabilidade, mas fazer isso manualmente não é exatamente trivial. Portanto, é preferível se você tiver acesso a algum software estatístico que tenha um pacote pronto para isso. Por exemplo, o comando Stata seria ivprobit(consulte o manual Stata para este comando, que também explica a abordagem de probabilidade máxima).

Se você precisar de referências para a teoria por trás do probit com variáveis ​​instrumentais, veja, por exemplo:

  • Newey, W. (1987) "Estimativa eficiente de modelos de variáveis ​​dependentes limitadas com variáveis ​​explicativas endógenas", Journal of Econometrics, vol. 36, pp. 231-250
  • Rivers, D. e Vuong, QH (1988) "Estimadores de informação limitados e testes de exogeneidade para modelos de probit simultâneos", Journal of Econometrics, vol. 39, pp. 347-366

Finalmente, é difícil combinar diferentes métodos de estimativa no primeiro e no segundo estágio, a menos que exista uma fundamentação teórica que justifique seu uso. Isso não quer dizer que não seja viável. Por exemplo, Adams et al. (2009) usam um procedimento de três etapas em que eles têm um probit "primeiro estágio" e um segundo estágio do OLS sem cair no problema de regressão proibido. Sua abordagem geral é:

  1. use probit para regredir a variável endógena no (s) instrumento (s) e variáveis ​​exógenas
  2. use os valores previstos da etapa anterior em um primeiro estágio do OLS junto com as variáveis ​​exógenas (mas sem o instrumental)
  3. faça o segundo estágio como de costume

Um procedimento semelhante foi empregado por um usuário no Statalist que desejava usar um primeiro estágio Tobit e um segundo estágio Poisson (veja aqui ). A mesma correção deve ser viável para o seu problema de estimativa.

Andy
fonte
1
Como mencionado na outra resposta, a "regressão proibida" parece ser sobre a inclusão de diferentes conjuntos covariáveis ​​nos modelos de primeiro estágio versus o segundo estágio, e não sobre o 1º estágio não linear seguido pelo 2º estágio linear. Na discussão da Arcand, p.47: "Em palavras, o procedimento 2SLS correto implica incluir todas as covariáveis ​​exógenas que aparecem na equação estrutural na forma reduzida de primeiro estágio. A regressão proibida envolve deixar alguns ou todos eles de fora. " O que o OP propõe não parece ser uma instância de regressão proibido ...
landroni
2

se você quiser uma prova mais detalhada (mas também mais técnica), pode dar uma olhada nas notas de Jean-Louis Arcand na p. 47 a 52.

Este não parece ser o caso. A discussão da Arcand não é sobre a forma funcional; em vez disso, trata-se da inclusão de diferentes conjuntos covariáveis ​​nos modelos de primeiro estágio versus os do segundo estágio. "Em palavras, o procedimento 2SLS correto implica incluir todas as covariáveis ​​exógenas que aparecem na equação estrutural na forma reduzida do primeiro estágio. A regressão proibida envolve deixar alguns ou todos eles de fora".

Voltando à pergunta original, eu recomendaria o uso de um OLS para o primeiro estágio e o probit para o segundo. Embora isso possa ser tecnicamente tendencioso, é provável (assumindo que você tenha um bom instrumento) ser menos tendencioso do que a abordagem não-IV.

draypresct
fonte