Efeito marginal do modelo Probit e Logit

12

Alguém pode explicar como calcular o efeito marginal do modelo Probit e Logit em termos leigos?

Eu sou novo em estatística e estou confuso sobre esses dois modelos.

Marca
fonte
Observe que os números que saem dos modelos Probit e Logit parecem ter a mesma medida, mas geralmente são numericamente diferentes. Quando você os traduz de volta para a vida real, a diferença entre os dois geralmente se torna muito menor.
Henry

Respostas:

15

XjXj

Não sabe ao certo como "Layman" é a próxima seção, mas você pode achar útil.

mjg(p)=kXkβk

mj=pXj=βjg[g1(XTβ)]=βjg(p)

g(p)g1(z)z=1g[g1(z)]z=g[g1(z)]g1(XTβ)=pg(p)=log(p)log(1p)g(p)=1p+11p=1p(1p)

mjlogit=βjp(1p)

p(1p)p=0p=10.25p=0.50.5p01p(1p)XjpXk,kj

g(p)=Φ1(p)g(p)=1ϕ[Φ1(p)]Φ(.)ϕ(.)

mjprobit=βjϕ[Φ1(p)]

mjlogit0.5g(p)=tan(π2[2p1])p0.50112π0.40.25

probabilityislogic
fonte
O effectspacote em R pode facilmente produzir tais parcelas de probabilidade prevista no eixo vertical vs X no eixo horizontal. Veja socserv.socsci.mcmaster.ca/jfox/Misc/effects/index.html
landroni
Veja também: stats.stackexchange.com/questions/18814/…
landroni 12/02/2015
5

Os modelos de logit e probit são normalmente usados ​​para descobrir uma probabilidade de que a variável dependente y seja 0 ou 1 com base em várias variáveis ​​de entrada.

Em inglês: suponha que você esteja tentando prever um valor binário, como se alguém irá ou não desenvolver uma doença cardíaca durante sua vida. Você tem várias variáveis ​​de entrada, como pressão arterial, idade, se é ou não fumante, seu IMC, onde moram etc. etc. Todas essas variáveis ​​podem contribuir de alguma maneira para as chances de alguém desenvolver doença cardíaca.

O efeito marginal de uma única variável de entrada é: se você aumentar essa variável um pouco, como isso afeta a probabilidade de ter uma doença cardíaca? Suponha que a pressão arterial aumente ligeiramente, como isso muda as chances de ter uma doença cardíaca? Ou se você aumentar a idade em um ano?

Alguns desses efeitos também podem ser não lineares: aumentar um pouco o IMC pode ter um efeito muito diferente para alguém que tem um IMC muito saudável do que para alguém que não tem.

robbrit
fonte
1

Você ainda deseja que seu leigo conheça o cálculo, pois o efeito marginal é a derivada de uma probabilidade ajustada em relação à variável de interesse. Como probabilidade ajustada é a função de link (logit, probit ou qualquer outra coisa) aplicada aos valores ajustados, você precisa da regra da cadeia para calculá-la. Portanto, nos modelos de índice linear (onde os parâmetros entram como algo como X'b), é igual ao tempo estimado dos parâmetros a derivada da função de link. Como a derivada é diferente em valores diferentes dos regressores (ao contrário do caso de um modelo linear), você deve decidir onde avaliar o efeito marginal. Uma escolha natural seria valores médios de todos os regressores. Outra abordagem seria avaliar o efeito de cada observação e, em seguida, média sobre eles. A interpretação difere de acordo.

Alex
fonte