vcovHC, vcovHAC, NeweyWest - qual função usar?

10

Estou tentando atualizar meu modelo baseado em lm () para obter erros e testes padrão corretos. Estou realmente confuso qual matriz de VC usar. O sandwichpacote oferece vcovHC, vcovHACe NeweyWest. Enquanto o primeiro é responsável apenas pela heterocedasticidade, os dois últimos são responsáveis ​​pela correlação serial e pela heterocedasticidade. No entanto, a documentação não diz muito sobre a diferença entre os dois últimos (pelo menos eu não entendi). Olhando para a própria função, percebi que NeweyWest realmente chama vcovHAC.

Empiricamente, os resultados coeftest(mymodel, vcov. = vcovHAC)e coeftest(mymodel, vcov. = NeweyWest)são loucos diferentes. Embora vcovHACesteja um pouco próximo dos resultados ingênuos do filme, o uso de NeweyWest todos os coeficientes se tornam insignificantes (os testes chegam perto de 1).

hans0l0
fonte
Geralmente, as páginas de ajuda do R fornecem um link para os artigos. Os detalhes precisos geralmente residem lá. O artigo da Zeileis, por exemplo, está disponível gratuitamente e contém muitas informações.
mpiktas 16/09/11
2
O artigo Zeileis afirma especificamente como vcovHACé diferente NeweyWest. Para resumir, diferentes métodos HAC diferem apenas na escolha dos pesos. NeweyWesttem seus pesos especificados, vcovHACé uma função geral, que permite fornecer seus próprios pesos e, por padrão, usa pesos de Andrews.
mpiktas
@mpiktas: thx para o resumo. Como eu não especifiquei nenhum peso, os respectivos pesos padrão devem ser usados. Agora que eu sei, talvez eu deva reformular minha pergunta para: Por que os pesos padrão diferentes do vcovHAC e do NeweyWest fazem uma diferença tão grande e como determinar pesos? Quero dizer, você sabe quais pesos STATA ou outros pacotes usam?
precisa saber é o seguinte
todos esses cálculos dependem do fato de que são variáveis ​​estacionárias, onde x t são os regressores e u t são os distúrbios. A estacionariedade é uma propriedade um pouco restritiva; portanto, verifique se existe. xtvocêtxtvocêt
mpiktas 16/09/11

Respostas:

3

O "sanduíche" em questão são dois pedaços de pão definidos pela informação esperada que inclui uma carne definida pela informação observada. Veja meus comentários aqui e aqui . Para uma regressão linear, a equação de estimativa é:

você(β)=XT(Y-XTβ)

A informação esperada (pão) é:

UMA=você(β)β=-(XTX)

A informação observada (carne) é:

B=E(você(β)você(β)T)=XT(Y-XTβ)(Y-XTβ)TX

UMA-1 1BUMA-1 1σ2(XTX)-1 1σ2n×n

R=(Y-XTβ)(Y-XTβ)

vcovHCR

REuEu=(YEu-βXEu.)2,0 0 em outro lugar

Este estimador funciona muito bem, exceto em amostras pequenas (<40 é frequentemente considerado). O HC1-3 são várias correções finitas de amostras. HC3 é geralmente o melhor desempenho.

Tgeegeepacote especificando a estrutura de covariância para AR-1ou similar.

Quanto ao uso, depende da natureza da análise dos dados e da questão científica. Eu não recomendaria a montagem de todos os tipos e a escolha da que melhor aparecesse, pois é uma questão de vários testes. Como mencionei anteriormente, o estimador vcovHC é consistente, mesmo na presença de um efeito autoregressivo, para que você possa usar e justificar um "modelo de correlação de independência de trabalho" em várias circunstâncias.

AdamO
fonte