Escolhendo entre modelo aditivo e multiplicativo?

Eu tenho um conjunto de dados que estou analisando atualmente.

Estou tendo dificuldades para decidir se um modelo aditivo deve ser usado para prever os dados ou se devo usar um modelo multiplicativo .

Conheço a diferença entre os dois e posso aplicar o modelo correto quando os dados brutos são lineares ... mas, neste caso, meus dados não são lineares.

Anexei uma série temporal dos meus dados - qual dos dois modelos devo usar e por quê?

(Meu instinto é seguir o modelo aditivo com base no fato de que a magnitude das flutuações sazonais (ou a variação em torno do ciclo de tendências) não parece variar com o nível da série temporal.

time-series model-selection seasonality Jonas Blaps
fonte

Respostas:

Eu iria para aditivo também. Como seu sinal aparente parece de baixa frequência, você pode ir um pouco além, pelo menos empiricamente. Você pode verificar, por exemplo, a homocedasticidade das diferenças finitas dos dados (primeira ou segunda ordem). Isso funcionaria como um filtro passa-alto muito bruto, onde você poderia esperar que o ruído fosse dominante.

Se o seu sinal for muito mais longo, mover janelas e transformadas de Fourier pode ajudar.

No entanto, quanto à previsão, você pode executar os dois modelos em paralelo e decidir qual deles aplicar com base, por exemplo, no melhor desempenho de um deles com base nas estatísticas anteriores. Este é um método heurístico que recentemente usei na previsão de resultados para a co-simulação de sistemas híbridos, onde nenhum modelo é conhecido: execute diferentes extrapolações em paralelo, muito rápido e decida. Não é muito teórico, mas funciona bem em nossos dados.

Se estiver interessado, eu poderia me desenvolver. A referência é chamada: CHOPtrey: extrapolação polinomial contextual on-line para co-simulação aprimorada de múltiplos núcleos de sistemas complexos

Como os dados são bastante curtos e não tenho certeza se temos um período sazonal completo, tentei realizar algumas análises de Fourier sobre os dados, seu gradiente e Laplaciano. A flutuação parece ser bastante periódica; portanto, no gráfico inferior, tentei projetar uma média móvel de "filtragem". O resíduo não varia muito em amplitude. Realmente não parece ser aleatório.

Laurent Duval
fonte

Muito obrigado pela sua resposta! Muito útil e informativo! Usarei alguns dados de retenção para a previsão. Portanto, na sua opinião, qual seria o melhor e mais simples teste estatístico que posso usar nos 'dados fora da amostra (retenção)' para testar a precisão das previsões?

Jonas Blaps

@JonasBlaps Você tem a possibilidade de compartilhar os dados?

Laurent Duval

O uso de dados de retenção de uma origem pode ser defeituoso quando houver anomalias nos dados de retenção. A previsão ideal de dados ruins pode levar a uma seleção incorreta do modelo. Isso geralmente é chamado de "a cauda da síndrome do cão"

IrishStat 28/11/16

@IrishStat Na verdade, eu estava prestes a sugerir um critério exponencialmente ponderada (no espírito de EWMA) que permite a esquecer progressivamente o passado passado

Laurent Duval

Em vez de assumir qualquer forma de média ponderada, é muito melhor determinar a forma ideal via ARIMA, levando em consideração qualquer estrutura determinística identificável, como mudanças de nível / tendências / pulsos sazonais e, é claro, pulsos.

IrishStat

Peguei os 55 valores e usei o AUTOBOX para detectar automaticamente um modelo híbrido, possivelmente incluindo estrutura determinística e estrutura ARIMA. O gráfico dos dados originais e o gráfico ACF da série original estão aqui. A AUTOBOX concluiu que uma única tendência e três manequins sazonais eram mais apropriados do que o SARIMA, além de incluir a estrutura de RA da ordem 1. Aqui está o modelo E aqui com os seguintes resumos estatísticos .

A plotagem de resíduos aqui está sugerindo suficiência com o ACF complementar dos resíduos aqui .

O gráfico Real, Ajuste e Previsão está aqui e o gráfico ajustado OUTLIER sugere claramente a necessidade dos 4 pulsos no modelo . Finalmente, a reformulação de Fo está aqui nos próximos 8 períodos.

Transformações como logaritmos ou modelos multiplicativos precisam ser justificadas e sugeridas pelos dados ou pelo usuário que possui determinado conhecimento de domínio. Não foi assim neste caso. Veja aqui quando são necessárias transformações de energia Quando (e por que) você deve registrar o log de uma distribuição (de números)? . Observe que a AUTOBOX convergiu essencialmente no Modelo Sazonal Aditivo HW com TREND e 4 anomalias e um coeficiente de AR (1) altamente significativo.

COMENTÁRIOS PARA LAURENT:

Três dos quatro comentários determinísticos foram necessários (manequins e pulsos de tendência, sazonal (trimestral)) e também precisavam da estrutura AR (1) para lidar com a memória de curto prazo.

IrishStat
fonte

Grato pelos detalhes

Laurent Duval