Entendendo o k lag no teste Dickey Fuller aumentado de R

15

Eu brinquei com alguns testes de raiz unitária em R e não sei bem o que fazer com o parâmetro k lag. Usei o teste Dickey Fuller aumentado e o teste Philipps Perron do pacote tseries . Obviamente, o parâmetro padrão (para o ) depende apenas do comprimento da série. Se eu escolher valores k diferentes, obtenho resultados bastante diferentes. rejeitando o nulo:kadf.testk

Dickey-Fuller = -3.9828, Lag order = 4, p-value = 0.01272
alternative hypothesis: stationary 
# 103^(1/3)=k=4 


Dickey-Fuller = -2.7776, Lag order = 0, p-value = 0.2543
alternative hypothesis: stationary
# k=0

Dickey-Fuller = -2.5365, Lag order = 6, p-value = 0.3542
alternative hypothesis: stationary
# k=6

mais o resultado do teste PP:

Dickey-Fuller Z(alpha) = -18.1799, Truncation lag parameter = 4, p-value = 0.08954
alternative hypothesis: stationary 

Observando os dados, acho que os dados subjacentes não são estacionários, mas ainda não considero esses resultados um backup forte, principalmente porque não entendo o papel do parâmetro . Se eu olhar para decompor / stl, vejo que a tendência tem forte impacto, em oposição a apenas uma pequena contribuição da variação restante ou sazonal. Minha série é de frequência trimestral.k

Alguma dica?

hans0l0
fonte
3
este livro deve responder a todas as suas perguntas.
Mvctas # 6/11
1
obrigado! Eu amo a série de usuário Springer, mas eu não sabia que este ...
hans0l0
hmm, iiuc esses testes apenas se phi = 1, não se phi> 1. Mas ainda assim a saída R diz que a alternativa é: estacionariedade. Então eles também verificam phi> 1? Obviamente, isso também não seria estacionário.
precisa saber é o seguinte

Respostas:

5

Já faz um tempo desde que olhei para os testes do ADF, no entanto, lembro de pelo menos duas versões do teste do ADF.

http://www.stat.ucl.ac.be/ISdidactique/Rhelp/library/tseries/html/adf.test.html

http://cran.r-project.org/web/packages/fUnitRoots/

O pacote fUnitRoots tem uma função chamada adfTest (). Eu acho que a questão da "tendência" é tratada de maneira diferente nesses pacotes.

Editar ------ Na página 14 do link a seguir, havia 4 versões (uroot descontinuadas) do teste adf:

http://math.uncc.edu/~zcai/FinTS.pdf

Mais um link. Leia a seção 6.3 no link a seguir. Ele faz um trabalho muito melhor do que eu poderia explicar o termo lag:

http://www.yats.com/doc/cointegration-en.html

Além disso, eu teria cuidado com qualquer modelo sazonal. A menos que você tenha certeza de que há alguma sazonalidade presente, evitaria usar termos sazonais. Por quê? Tudo pode ser dividido em termos sazonais, mesmo que não seja. Aqui estão dois exemplos:

#First example: White noise
x <- rnorm(200)

#Use stl() to separate the trend and seasonal term
x.ts <- ts(x, freq=4) 
x.stl <- stl(x.ts, s.window = "periodic")
plot(x.stl)

#Use decompose() to separate the trend and seasonal term
x.dec <- decompose(x.ts)
plot(x.dec)

#===========================================

#Second example, MA process
x1 <- cumsum(x)

#Use stl() to separate the trend and seasonal term
x1.ts <- ts(x1, freq=4)
x1.stl <- stl(x1.ts, s.window = "periodic")
plot(x1.stl)

#Use decompose() to separate the trend and seasonal term
x1.dec <- decompose(x1.ts)
plot(x1.dec)

O gráfico abaixo é da instrução plot (x.stl) acima. stl () encontrou um pequeno termo sazonal no ruído branco. Você pode dizer que o termo é tão pequeno que não é realmente um problema. O problema é que, em dados reais, você não sabe se esse termo é um problema ou não. No exemplo abaixo, observe que a série de dados de tendência possui segmentos nos quais se parece com uma versão filtrada dos dados brutos e outros segmentos nos quais pode ser considerada significativamente diferente dos dados brutos.

insira a descrição da imagem aqui

bill_080
fonte
1

O parâmetro k é um conjunto de defasagens adicionadas para corrigir a correlação serial. O A no ADF significa que o teste é aumentado pela adição de defasagens. A seleção do número de defasagens no ADF pode ser feita de várias maneiras. Uma maneira comum é começar com um grande número de atrasos selecionados a priori e reduzir o número de atrasos sequencialmente até que o maior atraso seja estatisticamente significativo.

Você pode testar a correlação serial nos resíduos após aplicar os atrasos no ADF.

RAH
fonte