Análise invariante em escala de séries temporais

8

Ao desenvolver um software de série temporal de uso geral, é uma boa ideia torná-lo invariante? Como alguém faria isso?

Tomei uma série temporal de cerca de 40 pontos e, em seguida, multipliquei por fatores que variavam de 10E-9 a 10E3 e, em seguida, executei as funções ARIMA do Forecast Pro e Minitab. No Forecast Pro, todos resultaram na mesma resposta (modelagem automática), enquanto no Minitab, não foram. Não tenho certeza do que o Forecast Pro faz, mas eles podem aumentar ou diminuir todos os números em uma determinada escala (digamos 100s) antes de executar o modelo. Essa é uma boa ideia em geral?

Samik R
fonte

Respostas:

7

Se o software calcular a soma dos erros ao quadrado na otimização (e a maioria irá), você poderá ter problemas com números muito grandes ou muito pequenos, devido à maneira como os números de ponto flutuante são armazenados. O mesmo se aplica a qualquer modelagem estatística, não apenas à análise de séries temporais. Uma maneira de evitar o problema é dimensionar os dados antes de executar o modelo e redimensionar os resultados. Para a maioria dos modelos de séries temporais, incluindo todos os modelos lineares, isso funcionará. Alguns modelos não lineares não serão dimensionados no entanto.

Quando estou analisando dados, muitas vezes eu mesmo os dimensionarei, não apenas para evitar possíveis problemas de otimização, mas também para facilitar a leitura de gráficos e tabelas.

Rob Hyndman
fonte
1
Além disso, convém consultar O que todo cientista da computação deve saber sobre aritmética de ponto flutuante, de David Goldberg, para obter conselhos sobre como lidar com questões de representação numérica.
fmark
@ Rob: Obrigado pela resposta. Eu acho que você está sugerindo que está tudo bem escalar a série antes de fazer a análise.
Samik R
@mark: Obrigado pelo comentário - eu estou bastante familiarizado com esse material, na verdade.
Samik R
@ Samik: Para modelos lineares como processos ARIMA gaussianos, sim.
Rob Hyndman
3
Dentro de vastos limites, o dimensionamento não faz diferença nos cálculos de ponto flutuante: simplesmente equivale a uma troca de expoente sem perda de precisão. Onde a escala pode ajudar é onde um cálculo envolve conjuntos de dados em escalas diferentes. Meu palpite é que as fórmulas de séries temporais estão usando alguma medida de tempo (milissegundos? Anos? Apenas etapas integrais?) Que podem ter um intervalo muito diferente do intervalo de dados. Boas estatísticas O SW escalará internamente suas matrizes para evitar perda de precisão; isso pode explicar as diferenças entre o FP e o Minitab.
whuber