Algumas advertências antes de prosseguir. Como costumo sugerir aos meus alunos, use as auto.arima()
coisas apenas como uma primeira aproximação ao seu resultado final ou se você deseja ter um modelo parcimonioso ao verificar se o seu modelo baseado em teoria rival se sai melhor.
Dados
Você deve começar claramente pela descrição dos dados de séries temporais com os quais está trabalhando. Na macroeconomia, você geralmente trabalha com dados agregados, e os meios geométricos (surpreendentemente) têm mais evidências empíricas para os dados de séries temporais macro, provavelmente porque a maioria deles se decompõe em tendência de crescimento exponencial .
A propósito, a sugestão de Rob "visualmente" funciona para séries temporais com parte sazonal clara , pois os dados anuais que variam lentamente são menos claros para os aumentos na variação. Felizmente, a tendência de crescimento exponencial é geralmente vista (se parece ser linear, não há necessidade de registros).
Modelo
Y( t ) = Xα1 11 1( T ) . . . Xαkk( t ) ε ( t )
Na econometria financeira, os logs são comuns devido à popularidade dos retornos dos logs, porque ...
As transformações de log possuem boas propriedades
αEuY( T )XEu( T )
Nos modelos de correção de erros, temos uma suposição empiricamente mais forte de que as proporções são mais estáveis ( estacionárias ) do que as diferenças absolutas.
Na econometria financeira, é fácil agregar os retornos do log ao longo do tempo .
Existem muitas outras razões não mencionadas aqui.
Finalmente
Observe que a transformação de log geralmente é aplicada a variáveis não-negativas (nível). Se você observar as diferenças de duas séries temporais (exportação líquida, por exemplo), nem é possível fazer o registro, é necessário procurar dados originais em níveis ou assumir a forma de tendência comum que foi subtraída.
[ adição após edição ] Se você ainda deseja um critério estatístico para quando fazer a transformação de log, uma solução simples seria qualquer teste de heterocedasticidade. No caso de uma variação crescente, eu recomendaria o teste de Goldfeld-Quandt ou similar. Em R, ele está localizado library(lmtest)
e é denotado por gqtest(y~1)
função. Basta regredir no termo de interceptação, se você não tiver nenhum modelo de regressão, y
é sua variável dependente.
Plote um gráfico dos dados contra o tempo. Se parecer que a variação aumenta com o nível da série, faça os registros. Caso contrário, modele os dados originais.
fonte
Por seus frutos, você deve conhecê-los
A suposição (a ser testada) é que os erros do modelo têm variação constante. Observe que isso não significa os erros de um modelo assumido. Quando você usa uma análise gráfica simples, está assumindo essencialmente um modelo linear no tempo.
Portanto, se você tiver um modelo inadequado, como pode ser sugerido por uma plotagem casual dos dados em relação ao tempo, poderá concluir incorretamente sobre a necessidade de uma transformação de energia. Box e Jenkins fizeram isso com o exemplo Airline Data. Eles não contabilizaram três valores incomuns nos dados mais recentes; portanto, concluíram incorretamente que havia maior variação nos resíduos no nível mais alto da série.
Para mais informações sobre esse assunto, consulte http://www.autobox.com/pdfs/vegas_ibf_09a.pdf
fonte
Você pode querer transformar séries de logarítmos quando elas são de alguma forma naturalmente geométricas ou quando o valor temporal de um investimento implica que você estará comparando com uma obrigação de risco mínima com um retorno positivo. Isso os tornará mais "linearizáveis" e, portanto, adequados para um relacionamento de recorrência diferenciado simples.
fonte