Ajustar uma média móvel exponencial para uma janela móvel significa?

7

O parâmetro alfa de uma média móvel exponencial define a suavização que a média aplica a uma série temporal. De maneira semelhante, o tamanho da janela de uma janela em movimento também define a suavização.

Existe alguma maneira de ajustar o parâmetro alfa, de modo que a suavização seja aproximadamente a mesma que a média de uma janela em movimento de um determinado tamanho? (Não está procurando resultados idênticos, obviamente, e as compensações estão corretas). Então, diga sintonizar alfa para que a série cronológica resultante seja o mais próxima possível do resultado fornecido por uma janela móvel de três meses?

edit : context: Estou tentando gerar proxy múltiplo para a umidade do solo, a partir de dados de chuva, que abstratamente representam profundidades diferentes (que eu suponho que estejam relacionadas a médias de chuva a longo prazo). Uma janela móvel permite-me calcular, por exemplo, a precipitação total nos últimos 3 dias, 3 meses ou ano, o que pode corresponder aos poucos centímetros de solo, ao medidor superior e à coluna de solo estendida, respectivamente. No entanto, uma janela em movimento requer dados do passado, que nem sempre estão disponíveis (por exemplo, no início de uma série). Se uma média exponencial for usada, é necessário armazenar apenas um valor para cada média (a média da etapa anterior), e esse valor pode ser inicializado com a média de longo prazo.

naught101
fonte
A que tipo de compensação você está se referindo?
Glen_b -Reinstala Monica
@Glen_b: como em, se os picos e vales nos dois meios são deslocados um em relação ao outro. Não tenho motivos para esperar que sejam, mas também não tenho certeza de que não.
naught101
Ah, desculpe, eu assumi que você quis dizer que queria encontrar um parâmetro alfa que implicava valores ajustados (/ previstos) próximos (próximos da média condicional). Você pretende, em vez disso, um parâmetro alfa que implique um nível semelhante de suavização, mesmo que os valores possam ser bem diferentes? (com efeito, algo como estar perto de variância condicional ao invés de perto em média condicional)
Glen_b -Reinstate Monica
Ah, com a sua janela em movimento, isso está voltado para trás ou centrado na observação? (iey^y=1ki=0k1yti vs y^y=12k+1i=kkyti) (tendo em mente que a suavização exponencial geralmente está apenas olhando para trás)
Glen_b -Reinstate Monica
Foi adicionado algum contexto, para o caso de ajudar a esclarecer a intenção da pergunta. No entanto, agora que penso nisso, eu estou querendo saber se uma média móvel exponencial é ainda válida no (exponenciais) dados de chuva ...
naught101

Respostas:

6

Deixei x ser a série temporal original e xmseja o resultado de uma suavização com uma média móvel simples com alguma largura da janela. Deixeif(x,α) ser uma função que retorna uma versão suavizada do x usando o parâmetro de suavização α.

Definir uma função de perda Lque mede a diferença entre a média móvel com janelas e a média móvel exponencial. Uma escolha simples seria o erro ao quadrado:

L(α)=xmf(x,α)2

Se você quiser que o erro seja invariável ao deslocamento / escala, defina como algo negativo da altura do pico da correlação cruzada normalizada.L

Encontre o valor de que minimiza :αL

minαL(α)

Aqui está um exemplo usando um sinal sinusoidal barulhento e o erro quadrado médio como função de perda:

insira a descrição da imagem aqui

Outro exemplo usando ruído branco como sinal:

insira a descrição da imagem aqui

A função de perda parece ser bem comportada e tem um único mínimo global para esses dois sinais diferentes, sugerindo que um solucionador de otimização 1d padrão possa funcionar (como eu costumava selecionar aqui). Mas não verifiquei que esse deve ser o caso. Em caso de dúvida, plote a função de perda e use um método de otimização mais sofisticado, se necessário.α

Editar :

Aqui está um gráfico do alfa ideal (para suavização exponencial) em função do tamanho da janela (para média móvel simples). Traçado para cada um dos sinais mostrados acima.

insira a descrição da imagem aqui

user20160
fonte
Hrmm. Portanto, essa é uma abordagem bastante justa, mas assume que o alfa será diferente para cada série temporal, para um determinado tamanho de janela. Esse é necessariamente o caso? Eu estava pensando que poderia haver alguma solução analítica geral ...
naught101
Eu também esperava. Esse é apenas um argumento empírico, mas tentei alguns sinais diferentes e o valor de alfa poderia ser diferente, mesmo quando a largura da janela era a mesma.
user20160
Qual é a janela que você usou para esses gráficos? A janela móvel exponencial do Pandas possui um argumento "centro de massa (com)" definido como: , que parece corresponder aproximadamente ao comprimento da janela em uma janela móvel normal. Seus planos também têm esse relacionamento? α=1/(1+com)
naught101
11
Editei o post para mostrar o alfa ideal em função do tamanho da janela. A função é realmente suave, mas pode variar dependendo do sinal. A otimização levou apenas ~ 1ms para 1000 amostras e ~ 160ms para 1e6, portanto, não é tão oneroso. Mas se você quiser evitá-lo, poderá gerar uma curva alfa vs. tamanho da janela para um único sinal de protótipo e usá-la para escolher alfa para outros sinais.
user20160
11
Como alternativa, você pode derivar um sinal fechado para expressão para um sinal simples com estatísticas bem definidas e aceitar apenas pequenas imprecisões que surjam de diferenças entre o sinal do modelo e os sinais reais.
user20160
2

Se eu entendi a pergunta corretamente, o problema é tentar ajustar uma série de pesos que diminui exponencialmente a um uniforme discreto (peso constante com ponto de corte):

! [Comparação das funções de peso EWMA com a média móvel comum

Claramente, um EWMA diminui rapidamente (se encaixa mal em defasagens mais antigas, onde a média móvel comum ainda tem alto peso) ou tem uma cauda muito mais distante no passado, ajustando mal a distribuição de peso, onde a média móvel comum não tem peso).

Exatamente qual opção fará melhor na correspondência dos resultados de pesos uniformes dependerá crucialmente de como você mede o desempenho e (naturalmente) das características da série (a média móvel comum e a EWMA seriam apenas razoavelmente adequadas para séries estacionárias, por exemplo, mas que abrange muitos casos com desempenho relativo potencialmente diferente para valores diferentes )αα

A questão deixa essas duas coisas vagas, então suspeito que não há muito mais a ser dito do que "depende" - sobre a semelhança da média condicional ou o tamanho da variação condicional aqui.

Glen_b -Reinstate Monica
fonte
0

Podemos pensar nisso como um problema de otimização de hiperparâmetros.

Temos um X_mean alvo que é o valor alvo.

Também temos uma função de perda, por exemplo, L2 (X_exponential - X_mean).

Estamos procurando um hiperparâmetro (alfa) para a média móvel exponencial para minimizar a perda.

jxieeducation
fonte