Seu caso é menos problemático do que o contrário. Os operadores de expectativas e projeções lineares passam por um primeiro estágio linear (por exemplo, OLS), mas não por não lineares, como probit ou logit. Portanto, não é um problema se regredir primeiro seu contínuo endógeno variável no seu instrumento (s) Z ,
X i = um + Z ' i pi + η i
e, em seguida, utilizar os valores ajustados em uma segunda etapa de probit para estimar
Pr ( Y i = 1 | X i ) = Pr ( βXZ
XEu= a + Z′Euπ+ ηEu
Pr ( YEu= 1 | XˆEu) = Pr ( βXˆEu+ ϵEu> 0 )
XˆEu
// use a toy data set as example
webuse nlswork
// set up the program including 1st and 2nd stage
program my2sls
reg grade age race tenure
predict grade_hat, xb
probit union grade_hat age race
drop grade_hat
end
// obtain bootstrapped standard errors
bootstrap, reps(100): my2sls
Neste exemplo, queremos estimar o efeito dos anos de escolaridade na probabilidade de pertencer a um sindicato. Dado que os anos de educação provavelmente são endógenos, nós os instrumentamos com anos de posse no primeiro estágio. Obviamente, isso não faz sentido do ponto de interpretação, mas ilustra o código.
Apenas certifique-se de usar as mesmas variáveis de controle exógenas no primeiro e no segundo estágio. No exemplo acima, são aqueles age, race
que o instrumento (não sensorial) tenure
está presente apenas no primeiro estágio.