Eu tenho um conjunto de dados de séries temporais (frequência diária) representando as vendas de um produto a um cliente ao longo do tempo. As vendas são representadas da seguinte forma:
em que cada número representa as vendas do produto em um dia.
O problema é que os métodos de previsão de séries temporais (ARMA, HoltWinters) funcionam bem para dados "contínuos" e "suaves", mas não estão produzindo bons resultados nesse caso.
Quero fazer uma previsão dessa série, com atenção a 2 pontos: (1) garantia de valores não negativos e (2) dados esparsos / não contínuos. Alguém sabe como abordar esse problema? Quais métodos / técnicas?
Obrigado!
time-series
forecast
Bernardo Aflalo
fonte
fonte
Respostas:
Eu tenho duas idéias aqui, talvez elas sejam úteis.
Ideia 1: Modelo de tempo entre eventos
Você pode pensar em seus dados como sendo gerados por dois processos: o primeiro é uma distribuição com intervalos de tempo e o segundo é uma distribuição com valores de compra. Portanto, para modelar seus dados, você pode criar uma distribuição (gaussiana?) Sobre os valores diferentes de zero em seu conjunto de dados e outra sobre os comprimentos das seqüências de zeros (poisson?).
Ideia 2: modelo de inventário de clientes
Mesmo que os eventos de vendas em seu conjunto de dados sejam escassos, você pode gastar um pouco de tempo para criar um modelo de por que o cliente está fazendo compras quando o faz. Em um modelo possível, o cliente tem um estoque que diminui com o tempo e faz compras quando o estoque ultrapassa um limite mínimo. Você pode usar seus dados de vendas para ajustar a inclinação (para retração linear) ou a taxa (para retração exponencial), bem como o limite.
Isso pode ficar arbitrariamente complexo, já que o cliente nesse modelo pode ter limites ou taxas de encolhimento diferentes em momentos diferentes ... mas, para iniciantes, pode ser uma abordagem útil para entender as coisas.
fonte
Nesse tipo de dados, as informações vêm de 2 lugares
Semelhante a uma resposta anterior , vou sugerir começar verificando o intervalo de tempo quanto a possíveis padrões. O segundo é verificar a relação entre a quantidade de vendasYEu com Yi - 1 e TEu , Ti - 1 . No caso mais geral, esses 2 devem estar correlacionados. Com base nisso, você pode decidir se deve modelá-los independentemente ou em conjunto. Um modelo comumente usado é o modelo de espaço de estado. A idéia básica aqui é decompor os ts esparsos em subcomponentes que não são escassos e fáceis de modelar.
Um modelo geral pode ser:
fonte