A não estacionariedade no logit / probit é importante?

8

Gostaria de perguntar - estou usando o logit para investigar, se algumas variáveis ​​aumentam o risco de crises cambiais. Eu tenho dados anuais de 1980 para muitos países (painel desequilibrado); a variável dummy é 1 se as crises monetárias começaram (de acordo com minha definição), 0 caso contrário. As variáveis ​​explicativas estão de acordo com algumas teorias, como conta corrente / PIB, ativo externo líquido / PIB, empréstimos / PIB e assim por diante ... Todas estão atrasadas (-1). Estou usando erros padrão robustos, que devem ser consistentes com a heterocedasticidade. No entanto, por exemplo, empréstimos ao PIB ou NFA / PIB não são estacionários (teste do painel). Isso importa? Eu não vi nenhum teste de papel para estacionariedade executando logit / probit. Para mim, também é intuitivo que isso não importe. Se estou testando se uma variável aumenta o risco de uma crise, isso não deve ser problema, que essa variável está aumentando permanentemente. Pelo contrário, o aumento da variável aumenta permanentemente o risco de crise e, quando atinge um nível insustentável, a crise ocorre. Por favor, você poderia me dar uma resposta, se estou certo?

Jirka
fonte
2
Existe algum motivo para você não poder usar efeitos de tempo fixo? Fazer isso com frequência controla alterações no nível de variáveis ​​não estacionárias. O logit usa a probabilidade máxima que assume erros latentes de iid. Se os erros forem correlacionados ao longo do tempo, isso poderá resultar em um ajuste tendencioso, independentemente de como os erros padrão são calculados. Novamente, o uso de efeitos fixos no tempo deve ser responsável pela maior parte disso.
Zachary Blumenfeld
2
Eles não estão permitindo efeito fixo no logit porque estão tentando evitar viés acidental de parâmetros, o que, pensando bem, faz sentido. Uma coisa que você pode fazer é executar um modelo de probabilidade linear, com e sem efeitos de tempo aleatório / fixo. Você pode fazer diagnósticos residuais para esses modelos e ver se suas margens de interesse mudam. Se seus resíduos dentro do grupo não são correlacionados e os controles de tempo não alteram significativamente as margens, você pode ficar bem com o logit (as margens médias do logit devem ser semelhantes ao modelo linear)
Zachary Blumenfeld,
2
Além disso, há algumas coisas interessantes que você pode fazer com a re-amostragem para reduzir o viés incidental em modelos de painel não lineares que eu acho que se aplica bem ao seu problema. <a href=" onlinelibrary.wiley.com/doi/10.1111/j.1468-0262.2004.00533.x/…> é um artigo de Hahn e Newey que faz isso com um canivete.Eu não saberia como implementar algo como isso em Eveiws ou STATA (Sorry), mas tenho certeza de que é capaz de fazer no STATA.
Zachary Blumenfeld
1
Eu não tenho 100% de certeza. A idéia com o modelo linear é que você pode facilmente fazer diagnósticos residuais para não estacionariedade (ou auto-correlação) nos resíduos. Os efeitos marginais médios para o logit devem ser extremamente próximos das margens do modelo linear. Usando esse fato, se você souber que o modelo linear é imparcial (via verificação dos resíduos), poderá dizer que o logit também está estimando os efeitos marginais médios de maneira imparcial (desde que você observe que as margens médias são praticamente iguais para os dois modelos). Assim, parece razoável acreditar que o logit é sem viés.
Zachary Blumenfeld
1
Quando se trata da primeira diferenciação, isso é como "des-significado" das variáveis ​​de séries temporais, que é muito semelhante à idéia de adicionar efeitos fixos ... controlando as alterações de nível para cada período de tempo individual. No entanto, o tratamento formal deste tipo pode ser complexo calmo e ainda há uma chance para autocorrelação nos resíduos <a href=" people.stern.nyu.edu/jsimonof/classes/2301/pdf/...> tem algumas sugestões sensatas usando Pearson resíduos para verificar se há autocorrelação.
Zachary Blumenfeld

Respostas:

5

Qualquer que seja o modelo que você esteja usando, os fundamentos da teoria da econometria devem ser verificados e respeitados. Os pesquisadores se esforçam para usar modelos muito sofisticados, mas muitas vezes - mais ou menos voluntariamente - esquecem os fundamentos da econometria; eles se tornam ridículos. A econometria nada mais é do que estimar a média e a variância de seus parâmetros, mas se a média, a variância e a covariância de suas variáveis ​​mudarem ao longo do tempo, dispositivos e análises adequados devem ser executados. Na minha opinião, os modelos probit / logit com dados não estacionários não fazem sentido porque você deseja ajustar o lado direito da sua equação (que não é estacionária) no lado esquerdo, que é uma variável binária. A estrutura da dinâmica temporal de suas variáveis ​​independentes deve ser coerente com as dependentes. Se alguns de seus regressores não são estacionários, você está especificando incorretamente sua relação; de fato, deve ser que a combinação de seus regressores seja estacionária. Então, acredito que provavelmente você deve fazer uma regressão em duas etapas. No primeiro, você encontra uma relação estacionária de suas variáveis, depois coloca essa relação no seu modelo probit / logit e estima apenas um parâmetro.

Obviamente, no primeiro passo, você deve ter na lista duas variáveis ​​integradas (no caso de cointegração) ou pelo menos duas variáveis ​​com o mesmo tipo de tendência. Se não for esse o caso, você tem um problema de variáveis ​​omitidas.

A alternativa para tudo isso é que você altera o escopo de sua análise e transforma todos os seus regressores em estacionários.

Cerbero
fonte
2

Sugiro olhar para os resultados de Chang Jiang Park (2006) e Park, Phillips (2000) . * De acordo com o primeiro artigo, os estimadores de logit são consistentes mesmo no caso de séries integradas (teorema 2 na página 6-7) e usuais. As estatísticas t podem ser usadas para os parâmetros de interesse no seu caso (os coeficientes nos regressores). Outros trabalhos dos mesmos autores desenvolvem a teoria econométrica para outros casos de processos não estacionários em modelos não lineares.

* Esses artigos tratam apenas a teoria; infelizmente, não consigo encontrar um exemplo de artigo empírico que realmente mencione a questão da não estacionariedade nesse contexto.

Giuseppe
fonte
1

Eu sei que este post é antigo, mas as pessoas fazem pesquisas e costumam usar essas coisas como referência.

Vamos simplificar. Vamos ter um modelo de probabilidade individual de inadimplência em uma hipoteca como nosso Y. Agora vamos executar o PIB nivelado nela. Digamos que seus dados sejam 2002-2017, trimestralmente. Você tem milhões de observações que no momento T compartilham as mesmas variáveis ​​econômicas. Eu escolho esse prazo por um bom motivo.

O que você obterá como um relacionamento? Oh cara, você verá que shazaam, menor PIB está correlacionado com padrões mais altos. Parece bom, certo?

Mas agora vamos prever isso, digamos 50 anos (por diversão). Considere o PIB esperado com uma taxa de crescimento histórica, digamos 2%, e extrapole o PIB. Agora execute a previsão. O que você encontrou? Shazaam, como mágica, a probabilidade de inadimplência tenderá para 0%.

Você teria o oposto se escolhesse o número total de desempregados (não a taxa). Você encontrará esse shazaam, prevê-o no futuro e a probabilidade de tendências padrão para 100%.

Ambos são ridículos. E aqui está o kicker. Se você fizesse um teste estacionário em alguns desses períodos de tempo, descobriria que eles são estacionários. O motivo é que você pode dividir uma série não estacionária em partes estacionárias. Principalmente porque o PIB real aumentou, diminuiu e aumentou no período.

Sim, seu ajuste na amostra ficará bem. Mas suas previsões não terão sentido.

Vejo isso frequentemente na modelagem de métricas de risco.

stratozyck
fonte
-1

Você está claramente bem do ponto de vista teórico. É um entendimento equivocado das séries não estacionárias que elas têm meios de mudança. Eles não têm intenção. A média da amostra é um número aleatório porque converge para nenhum ponto e, portanto, parece mudar. Isso também não é problema para logit ou probit.

π

Ao mapear uma série não estacionária para um conjunto bem delimitado, você criou um problema bem delimitado, pois a solução final precisa ser mapeada para o intervalo [0,1].

Todos os índices contábeis devem ter uma variação e todos os retornos financeiros devem ter uma variação. Veja o artigo em https://papers.ssrn.com/sol3/papers.cfm?abstract_id=2828744

Você não precisa se preocupar intrinsecamente com erros robustos. É um equívoco das séries não estacionárias que elas são heterocedásticas. Eles não são; eles são questionados porque não têm como formar uma variação em primeiro lugar; portanto, é novamente um número aleatório. A estrutura dos termos de erro tem mais a ver com o modelo que mapeia do que a falta de estacionariedade.

Onde você pode enfrentar um problema é com o conceito de covariância. A distribuição dos retornos sobre ações é de uma distribuição que não possui uma matriz de covariância. Não é que as ações não possam ser recuperadas, mas não podem covary. O mesmo se aplica às economias. É um conceito mais complexo que a covariância, que é um relacionamento simples. Você vai querer ler o artigo acima e pensar cuidadosamente em seus relacionamentos de modelo.

Dave Harris
fonte