Quando é necessário incluir o atraso da variável dependente em um modelo de regressão e qual atraso?

14

Os dados que queremos usar como variável dependente se parecem com isso (são dados de contagem). Tememos que, uma vez que tenha um componente cíclico e uma estrutura de tendências, a regressão acabe tendendo de alguma forma.

insira a descrição da imagem aqui

Usaremos uma regressão binomial negativa, caso isso ajude. Os dados são um painel balanceado, um manequim por indivíduo (estados). A imagem mostrada exibe a soma da variável dependente para todos os estados, mas a maioria dos estados possui um comportamento semelhante. Estamos considerando um modelo de efeitos fixos. As variáveis ​​dependentes não são fortemente correlacionadas; parte da pesquisa é encontrar uma relação inesperada entre essas variáveis; portanto, uma relação fraca é realmente algo bom.

  1. Quais são os perigos exatos de não incluir uma variável de atraso da variável dependente?
  2. Se for necessário incluir um, existe um teste para saber qual (s).

A implementação está sendo feita em R.

Nota : Eu li este post, mas ele não ajudou no nosso problema.

Mauricio G Tec
fonte

Respostas:

14

Um modelo de painel dinâmico pode fazer sentido se você tiver um modelo de retaliação olho por olho para homicídios. Por exemplo, se a taxa de homicídios fosse em grande parte impulsionada por brigas de gangues, os assassinatos no momento poderiam muito bem ser uma função das mortes em t - 1 , ou outros atrasos. tt1

Vou responder suas perguntas fora de ordem. Suponha que o DGP seja

yit=δyit1+xitβ+μi+vit,

onde os erros e v são independentes entre si e entre si. Você está interessado em realizar o teste se δ = 0 (pergunta 2).μvδ=0

Se você usa o OLS, é fácil ver que e a primeira parte do erro estão correlacionados, o que torna o OLS enviesado e inconsistente, mesmo quando não há correlação serial no v . Precisamos de algo mais complicado para fazer o teste.yit1v

A próxima coisa que você pode tentar é o estimador de efeitos fixos com a transformação inside , onde você transforma os dados subtraindo a média de cada unidade , y i , de cada observação. Isso apaga μ , mas esse estimador sofre com o viés de Nickell , que não desaparece à medida que o número de observações N aumenta, por isso é inconsistente para grandes painéis N e T pequenos . No entanto, à medida que T cresce, você obtém consistência de δ e β . Judson e Owen (1999) fazem algumas simulações com N = 20 ,yy¯iμNNTTδβ e T = 5 , 10 , 20 , 30 e encontrado a polarização estar a aumentar em δ e diminuindo em T . No entanto, mesmo para T = 30 , o viés pode chegar a 20 % do valor real do coeficiente. Isso são más notícias! Portanto, dependendo das dimensões do seu painel, você pode evitar o estimador interno FE. Se δ > 0 , o viés é negativo, então a persistência de y é subestimada. Se os regressores estiverem correlacionados com o atraso, o β também será enviesado.N=20,100T=5,10,20,30δTT=3020%δ>0yβ

Outra abordagem simples de FE é diferenciar os dados pela primeira vez para remover o efeito fixo e usar para instrumentar para Δ y i t - 1 = y i t - 1 - y i t - 2 . Você também usa x i t -yit2Δyit1=yit1yit2 como um instrumento para si. Anderson e Hsiao (1981)é a referência canônica. Isto é consistente estimador (desde que os explicativas X s são pré-determinados e oxitxit1Xos termos de erro originais não são correlacionados serialmente), mas não são totalmente eficientes, pois não usa todas as condições de momento disponíveis e não usa o fato de que o termo de erro agora é diferenciado. Essa provavelmente seria minha primeira escolha. Se você acha que segue um processo AR (1), pode usar o terceiro e o quarto atrasos de y .vy

Arellano e Bond (1991) derivam um estimador de método generalizado de momentos (GMM) mais eficiente, que foi estendido desde então, relaxando algumas das suposições. O capítulo 8 do livro do painel de Baltagi é uma boa pesquisa dessa literatura, embora não lide com a seleção de defasagens, até onde posso dizer. Essa é a métrica do estado da arte, mas mais exigente tecnicamente.

Eu acho que o plmpacote no R possui alguns desses recursos. Os modelos de painel dinâmico estão no Stata desde a versão 10 e o SAS tem pelo menos a versão GMM . Nenhum desses são modelos de dados de contagem, mas isso pode não ser um grande problema, dependendo dos seus dados. No entanto, aqui está um exemplo de um modelo de painel Poisson dinâmico do GMM no Stata.

A resposta para sua primeira pergunta é mais especulativa. Se você deixar de fora o atraso e primeira diferença, acredito que β ainda pode ser estimado de forma consistente, embora menos precisamente desde a variância é agora maior. Se esse é o parâmetro de seu interesse, isso pode ser aceitável. O que você perde é que você não pode dizer se houve muitos homicídios na área X porque foram muitos no mês passado ou porque a área X tem propensão à violência. Você desiste da capacidade de distinguir entre dependência de estado e heterogeneidade não observada (questão 1). yβ

Dimitriy V. Masterov
fonte
Então você usa os níveis como instrumento quando você tem uma série diferenciada e as diferenças quando você tem uma série em níveis ?
Andy W
Soltando o índice , você pode usar Δ y t - 2 = y t - 2 - y t - 3 ou y t - 2 como instrumentos para a diferença Δ y t - 1 = y t - 1 -iΔyt2=yt2yt3yt2 . Arellano (1989) mostra que a primeira abordagem possui um ponto de singularidade e grandes variações para uma grande variedade de valores de parâmetros. O instrumento de níveis não possui nenhum, e é por isso que eu o recomendeiΔyt1=yt1yt2
Dimitriy V. Masterov 10/09