Eu brinquei com alguns testes de raiz unitária em R e não sei bem o que fazer com o parâmetro k lag. Usei o teste Dickey Fuller aumentado e o teste Philipps Perron do pacote tseries . Obviamente, o parâmetro padrão (para o ) depende apenas do comprimento da série. Se eu escolher valores k diferentes, obtenho resultados bastante diferentes. rejeitando o nulo:adf.test
Dickey-Fuller = -3.9828, Lag order = 4, p-value = 0.01272
alternative hypothesis: stationary
# 103^(1/3)=k=4
Dickey-Fuller = -2.7776, Lag order = 0, p-value = 0.2543
alternative hypothesis: stationary
# k=0
Dickey-Fuller = -2.5365, Lag order = 6, p-value = 0.3542
alternative hypothesis: stationary
# k=6
mais o resultado do teste PP:
Dickey-Fuller Z(alpha) = -18.1799, Truncation lag parameter = 4, p-value = 0.08954
alternative hypothesis: stationary
Observando os dados, acho que os dados subjacentes não são estacionários, mas ainda não considero esses resultados um backup forte, principalmente porque não entendo o papel do parâmetro . Se eu olhar para decompor / stl, vejo que a tendência tem forte impacto, em oposição a apenas uma pequena contribuição da variação restante ou sazonal. Minha série é de frequência trimestral.
Alguma dica?
fonte
Respostas:
Já faz um tempo desde que olhei para os testes do ADF, no entanto, lembro de pelo menos duas versões do teste do ADF.
http://www.stat.ucl.ac.be/ISdidactique/Rhelp/library/tseries/html/adf.test.html
http://cran.r-project.org/web/packages/fUnitRoots/
O pacote fUnitRoots tem uma função chamada adfTest (). Eu acho que a questão da "tendência" é tratada de maneira diferente nesses pacotes.
Editar ------ Na página 14 do link a seguir, havia 4 versões (uroot descontinuadas) do teste adf:
http://math.uncc.edu/~zcai/FinTS.pdf
Mais um link. Leia a seção 6.3 no link a seguir. Ele faz um trabalho muito melhor do que eu poderia explicar o termo lag:
http://www.yats.com/doc/cointegration-en.html
Além disso, eu teria cuidado com qualquer modelo sazonal. A menos que você tenha certeza de que há alguma sazonalidade presente, evitaria usar termos sazonais. Por quê? Tudo pode ser dividido em termos sazonais, mesmo que não seja. Aqui estão dois exemplos:
O gráfico abaixo é da instrução plot (x.stl) acima. stl () encontrou um pequeno termo sazonal no ruído branco. Você pode dizer que o termo é tão pequeno que não é realmente um problema. O problema é que, em dados reais, você não sabe se esse termo é um problema ou não. No exemplo abaixo, observe que a série de dados de tendência possui segmentos nos quais se parece com uma versão filtrada dos dados brutos e outros segmentos nos quais pode ser considerada significativamente diferente dos dados brutos.
fonte
O parâmetro k é um conjunto de defasagens adicionadas para corrigir a correlação serial. O A no ADF significa que o teste é aumentado pela adição de defasagens. A seleção do número de defasagens no ADF pode ser feita de várias maneiras. Uma maneira comum é começar com um grande número de atrasos selecionados a priori e reduzir o número de atrasos sequencialmente até que o maior atraso seja estatisticamente significativo.
Você pode testar a correlação serial nos resíduos após aplicar os atrasos no ADF.
fonte