Uma maneira mais simples de calcular a média móvel ponderada exponencialmente?

8

Método proposto:

Dada uma série temporal , quero calcular uma média móvel ponderada com uma janela média de pontos, em que as ponderações favorecem valores mais recentes que valores mais antigos. NxiN

Ao escolher os pesos, estou usando o fato familiar de que uma série geométrica converge para 1, ou seja, , desde que sejam aceitos infinitos termos.(12)k

Para obter um número discreto de pesos que somam a unidade, estou simplesmente pegando os primeiros termos da série geométrica e depois normalizando pela soma.( 1N(12)k

Quando , por exemplo, isso fornece pesos não normalizadosN=4

0.0625  0.1250  0.2500  0.5000

que, após normalizar pela soma, dá

0.0667  0.1333  0.2667  0.5333

A média móvel é então simplesmente a soma do produto dos 4 valores mais recentes em relação a esses pesos normalizados.

Esse método generaliza da maneira óbvia para mover janelas de comprimento e parece computacionalmente fácil também.N

Questão:

Existe alguma razão para não usar essa maneira simples de calcular uma média móvel ponderada usando 'pesos exponenciais'?

Eu pergunto porque a entrada da Wikipedia para EWMA parece mais complicada. O que me faz pensar se a definição de livro didático de EWMA talvez tenha algumas propriedades estatísticas que a definição simples acima não possui? Ou eles são de fato equivalentes?

Assad Ebrahim
fonte
Como você normalizou a soma? Você poderia descrever o método escolhido? Não está muito claro a partir do post. que, após normalizar por sua soma, fornece 0,0667 0,1333 0,2667 0,5333
Para começar, você assume 1) que não existem valores incomuns, mudanças de nível, tendências de tempo e manequins sazonais; 2) que a média ponderada ideal possui pesos que caem em uma curva suave, descritível por 1 coeficiente; 3) que a variação do erro é constante; que não existem séries causais conhecidas; Por que todas as suposições?
precisa saber é o seguinte
@ Ravi: No exemplo dado, a soma dos quatro primeiros termos é 0,9375 = 0,0625 + 0,125 + 0,25 + 0,5. Portanto, os quatro primeiros termos detêm ~ 93,8% do peso total (6,2% está na cauda truncada). Use isso para obter pesos normalizados que somam a unidade, redimensionando (dividindo) por 0,9375. Isso fornece 0,06667, 0,1333, 0,2667, 0,5333.
Assad Ebrahim
2
@IrishStat É melhor não atrair as pessoas para fora do site em comentários ou respostas, pois os conselhos que você fornece fora do site não fazem parte da pergunta e, portanto, não ajudam os leitores posteriores (por exemplo, veja o motivo 1. da principal resposta aqui ); se é um conselho adequado, geralmente deve estar aqui.
Glen_b -Reinstala Monica
1
Explicação pormenorizada da EWMA: mathematical-modeling-python.blogspot.dk/2013/11/...
tashuhka

Respostas:

10

Descobri que a computação de médias ponderadas exponencialmente usando , éα<1x¯x¯+α(xx¯)α<1

  • um método simples de uma linha,
  • que é facilmente, mesmo que apenas aproximadamente, interpretável em termos de um "número efetivo de amostras" (compare este formulário ao formulário para calcular a média de execução),N=α1
  • requer apenas o dado atual (e o valor médio atual) e
  • é numericamente estável.

Tecnicamente, essa abordagem incorpora toda a história à média. As duas principais vantagens de usar a janela completa (em oposição à truncada discutida na pergunta) são que, em alguns casos, pode facilitar a caracterização analítica da filtragem e reduz as flutuações induzidas se houver dados muito grandes (ou pequenos) O valor faz parte do conjunto de dados. Por exemplo, considere o resultado do filtro se os dados forem zero, exceto por um dado cujo valor é .106

Dave
fonte
Olá. A fórmula que você sugeriu inclui todos os valores anteriores com pesos exponencialmente decrescentes? Então toda a série temporal seria incluída, não apenas os pontos mais recentes ? Referindo-se ao exemplo colocado na pergunta, você está sugerindo que a configuração ou se aproxime da média móvel de 4 pontos? N = 4 α = 0,25 α = 0,5NN=4α=0.25α=0.5
Assad Ebrahim 29/11
1
Ok, isso faz sentido. Parece que, nos casos em que os valores das séries temporais podem ser afetados por transitórios significativos de curto prazo que não têm qualquer influência após um certo período de tempo, pode ser vantajoso usar o EWMA truncado com escolhido para corresponder a esse ` característica da relevância da informação histórica. A EWMA truncada nesse caso impediria que um pico de tivesse algum impacto sobre o resultado, mesmo que ocorresse no passado recente, desde que ocorresse fora da região de relevância da informação ... Aceitando sua resposta - obrigado ! 10 6N106
Assad Ebrahim