Como interpreto um modelo probit no Stata?

13

Não sei como interpretar essa regressão probit que executei no Stata. Os dados estão em aprovação de empréstimo e branco é uma variável fictícia que = 1 se uma pessoa era branca e = 0 se a pessoa não era. Qualquer ajuda sobre como ler isso seria muito apreciada. O que estou procurando principalmente é como encontrar a probabilidade estimada de aprovação de empréstimos para brancos e não brancos. Alguém também pode me ajudar com o texto aqui e como torná-lo normal? Me desculpe, eu não sei como fazer isso.

. probit approve white

Iteration 0:   log likelihood = -740.34659  
Iteration 1:   log likelihood = -701.33221  
Iteration 2:   log likelihood = -700.87747  
Iteration 3:   log likelihood = -700.87744  

Probit regression                                 
Number of obs   =       1989

LR chi2(1)      =      78.94

Prob > chi2     =     0.0000

Log likelihood = -700.87744                       

Pseudo R2       =     0.0533

para a variável branco:

Coef.: .7839465  
Std. Err.: .0867118  
z: 9.04  
P>|z|: 0.000  
95% Conf. Interval: .6139946-.9538985  

para a constante:

Coef.: .5469463  
Std. Err.: .075435  
z: 7.25  
P>|z|: 0.000  
95% Conf. Interval: .3990964-.6947962  
Kyle
fonte

Respostas:

44

Em geral, você não pode interpretar os coeficientes da saída de uma regressão probit (pelo menos de nenhuma maneira padrão). Você precisa interpretar os efeitos marginais dos regressores, ou seja, quanto a probabilidade (condicional) da variável de resultado muda quando você altera o valor de um regressor, mantendo todos os outros regressores constantes em alguns valores. Isso é diferente do caso de regressão linear em que você está interpretando diretamente os coeficientes estimados. Isso ocorre porque, no caso de regressão linear, os coeficientes de regressão são os efeitos marginais .

Na regressão probit, há uma etapa adicional de computação necessária para obter os efeitos marginais depois de calcular o ajuste da regressão probit.

Modelos de regressão linear e probit

  • Regressão probit: Lembre-se de que, no modelo probit, você está modelando a probabilidade (condicional) de um resultado "bem-sucedido", ou seja, , P [ Y i = 1 X 1 i , , X K i ; β 0 , , β K ] = Φ ( β 0 + K k = 1 β k X k i ) em que ΦYEu=1

    P[YEu=1X1Eu,...,XKEu;β0 0,...,βK]=Φ(β0 0+k=1KβkXkEu)
    é a função de distribuição cumulativa da distribuição normal padrão. Este basicamente diz que, à condição das variáveis explicativas, a probabilidade de que a variável de saída, Y i é 1, é uma certa função de uma combinação linear das regressores.Φ()YEu
  • Regressão linear : compare isso com o modelo de regressão linear, em que

E(YEuX1Eu,...,XKEu;β0 0,...,βK)=β0 0+k=1KβkXkEu

Efeitos marginais

À exceção do modelo de regressão linear, os coeficientes raramente têm interpretação direta. Normalmente, estamos interessados ​​nos efeitos ceteris paribus das alterações nos regressores que afetam os recursos da variável resultado. Essa é a noção que os efeitos marginais medem.

  • Regressão linear : agora eu gostaria de saber quanto a média da variável de resultado se move quando movo um dos regressores

E(YEuX1Eu,...,XKEu;β0 0,...,βK)XkEu=βk

k

  • Regressão probit: no entanto, é fácil ver que esse não é o caso da regressão probit

P[YEu=1X1Eu,...,XKEu;β0 0,...,βK]XkEu=βkϕ(β0 0+k=1KβkXkEu)
ϕ()

Como você calcula essa quantidade e quais são as opções dos outros regressores que devem inserir essa fórmula? Felizmente, o Stata fornece esse cálculo após uma regressão probit e fornece alguns padrões das escolhas dos outros regressores (não há um acordo universal sobre esses padrões).

Regressores discretos

XkEu{0 0,1}

ΔXkEuP[YEu=1X1Eu,...,XKEu;β0 0,...,βK]=βkϕ(β0 0+eu=1k-1βeuXeuEu+βk+eu=k+1KβeuXeuEu)-βkϕ(β0 0+eu=1k-1βeuXeuEu+eu=k+1KβeuXeuEu)

Computando efeitos marginais no Stata

Regressão probit: Aqui está um exemplo de cálculo de efeitos marginais após uma regressão probit no Stata.

webuse union   
probit union age grade not_smsa south##c.year
margins, dydx(*)

Aqui está a saída que você obterá do marginscomando

. margins, dydx(*)

Average marginal effects                          Number of obs   =      26200
Model VCE    : OIM

Expression   : Pr(union), predict()
dy/dx w.r.t. : age grade not_smsa 1.south year

------------------------------------------------------------------------------
             |            Delta-method
             |      dy/dx   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
         age |    .003442    .000844     4.08   0.000     .0017878    .0050963
       grade |   .0077673   .0010639     7.30   0.000     .0056822    .0098525
    not_smsa |  -.0375788   .0058753    -6.40   0.000    -.0490941   -.0260634
     1.south |  -.1054928   .0050851   -20.75   0.000    -.1154594   -.0955261
        year |  -.0017906   .0009195    -1.95   0.051    -.0035928    .0000115
------------------------------------------------------------------------------
Note: dy/dx for factor levels is the discrete change from the base level.

Isso pode ser interpretado, por exemplo, que a alteração de uma unidade na agevariável aumenta a probabilidade de status da união em 0,003442. Da mesma forma, sendo do sul, diminui a probabilidade de status sindical em 0,1054928

Regressão linear : Como verificação final, podemos confirmar que os efeitos marginais no modelo de regressão linear são os mesmos que os coeficientes de regressão (com uma pequena torção). Executando a regressão a seguir e computando os efeitos marginais após

sysuse auto, clear
regress mpg weight c.weight#c.weight foreign
margins, dydx(*)

apenas devolve os coeficientes de regressão. Observe o fato interessante de que o Stata calcula o efeito marginal líquido de um regressor, incluindo o efeito através dos termos quadráticos, se incluído no modelo.

. margins, dydx(*)

Average marginal effects                          Number of obs   =         74
Model VCE    : OLS

Expression   : Linear prediction, predict()
dy/dx w.r.t. : weight foreign

------------------------------------------------------------------------------
             |            Delta-method
             |      dy/dx   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
      weight |  -.0069641   .0006314   -11.03   0.000    -.0082016   -.0057266
     foreign |    -2.2035   1.059246    -2.08   0.038    -4.279585   -.1274157
------------------------------------------------------------------------------
tchakravarty
fonte
ΔXkP[Y=1]P[Y=1]
1

βumage

. webuse union

. keep union age grade

. probit union age grade

Iteration 0:   log likelihood =  -13864.23  
Iteration 1:   log likelihood = -13796.359  
Iteration 2:   log likelihood = -13796.336  
Iteration 3:   log likelihood = -13796.336  

Probit regression                               Number of obs     =     26,200
                                                LR chi2(2)        =     135.79
                                                Prob > chi2       =     0.0000
Log likelihood = -13796.336                     Pseudo R2         =     0.0049

------------------------------------------------------------------------------
       union |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
         age |   .0051821   .0013471     3.85   0.000     .0025418    .0078224
       grade |   .0373899   .0035814    10.44   0.000     .0303706    .0444092
       _cons |  -1.404697   .0587797   -23.90   0.000    -1.519903   -1.289491
------------------------------------------------------------------------------

Então faça

predict yhat

βumage20+βgrumade12+βconsnormal()

di normal(.0051821*20 + .0373899*12 + -1.404697)
.19700266

βumage

Bryan
fonte