É válido usar um modelo ARMAX para atribuição de TV?

7

Suponha que eu tenha um site com algum tráfego horário básico. Também executo publicidade na TV intermitentemente, o que aumenta meu tráfego na web. Quero determinar quanto efeito minha publicidade na TV está causando em termos de aumento do tráfego da web.

Se eu ajustar um modelo ARMAX com impressões ou gastos com publicidade horária na TV como variáveis ​​exógenas, é válido afirmar que os termos da AR representam o "tráfego de linha de base", enquanto os termos da regressão representam o tráfego que deve ser atribuído à publicidade na TV?

Aqui está um exemplo de código do que estou tentando fazer:

library(forecast)

xmat <- as.matrix(cbind(data[,c("AdSpend","Impressions")]))
xvar <- data$WebSessions

fit <- Arima(x=xvar, xreg=xmat, order=c(12,0,0), include.constant=FALSE)

reg_terms <- fit$coef["AdSpend"] * data$AdSpend + fit$coef["Impressions"] * data$Impressions
AR_terms <- fitted(fit) - reg_terms

Posso criar um gráfico de áreas empilhadas usando AR_terms (o tráfego da Web por hora da linha de base) e reg_terms (a TV atribui o tráfego por hora).

insira a descrição da imagem aqui

Essa é uma abordagem válida?

Obrigado pela ajuda.

Pedro
fonte

Respostas:

2

Esta é uma excelente pergunta. Eu recomendo que você tome uma xícara de café e leia com atenção a postagem de Rob Hyndman no blog "The ARIMAX model muddle" .

Basicamente, a resposta é não. Se você ajustar um modelo simples de AR (I) MAX, seus coeficientes covariáveis ​​não poderão ser interpretados como o efeito de promoção. O problema é que uma mudança em um valor covariável terá um efeito na previsão que depende de ajustes anteriores . Isso é muito difícil de interpretar e comunicar.

No entanto, nem tudo está perdido, porque sua chamada para Rs Arima()não se encaixa de fato em um modelo AR (I) MAX. Em vez disso, ele primeiro regride suas observações sobre as covariáveis ​​e depois modela os resíduos com um processo AR (I) MA. Ou seja, ele se encaixa na chamada regressão com erros de AR (I) MA . E para esse modelo, sua interpretação - as covariáveis ​​e seus coeficientes capturam efeitos promocionais, enquanto a parte ARMA captura "o resto" - é perfeitamente válida.

Agora, se um modelo AR (I) MAX ou uma regressão com erros AR (I) MA produz previsões melhores que eu não conheço. Dado que não conheço uma maneira fácil de realmente ajustar um modelo AR (I) MAX em R e as dificuldades de interpretação descritas acima, eu recomendo que você não se preocupe excessivamente com os verdadeiros modelos e modelos AR (I) MAX com o que Arima()te dá.

No entanto, suspeito que a navegação na web e a exibição de TV possam ter - os padrões intra-dia podem muito bem ser diferentes entre o fim de semana e o resto da semana. Não vejo isso no seu gráfico, mas você pode verificar se seus dados exibem isso. Nesse caso, houve algum trabalho de previsão com várias sazonalidades , principalmente usando variantes de suavização exponencial e / ou modelos de espaço de estado. Alguns deles podem ser capazes de modelar simultaneamente várias sazonalidades e variáveis ​​explicativas.

Stephan Kolassa
fonte
Ótima resposta, obrigado! Estou planejando construir um modelo mais complexo, mas só queria ver se a abordagem geral está correta.
Peter