Se tivermos uma série temporal longa e de alta resolução, com muito ruído, geralmente faz sentido agregar os dados em uma resolução mais baixa (digamos, valores diários a mensais) para entender melhor o que está acontecendo, removendo efetivamente alguns dos o barulho.
Eu vi pelo menos um papel que, em seguida, aplica-se algumas estatísticas para os dados agregados, incluindo a para uma regressão linear em uma variável separada. Isso é válido? Eu teria pensado que o processo de média modificaria bastante o resultado, devido ao ruído reduzido.
Em geral, algumas estatísticas podem ser aplicadas aos dados agregados de séries temporais e outras não? Se sim, quais são? Aqueles que são combinações lineares, talvez?
time-series
aggregation
naught101
fonte
fonte
Respostas:
Eu acho que a pergunta, como no título, é muito ampla para ser respondida de uma maneira útil, tanto mais que provavelmente dependerá do método de agregação e da estatística em questão.
Isso se aplica até ao "médio": você tenta preservar a forma e a intensidade do sinal (por exemplo, filtros Savitzky-Golay) ou tenta preservar a área sob o sinal (por exemplo, loess)?
As estatísticas relacionadas ao ruído são obviamente afetadas: esse é geralmente o objetivo da agregação.
Essa modificação provavelmente é o objetivo da agregação.
Em geral, você pode fazer muitas coisas com seus dados, mas precisa
O que é uma agregação válida também dependerá do seu aplicativo.n
Por exemplo: estou trabalhando com dados espectroscópicos. É muito comum agregar espectros únicos em espectros médios: o processo de medição significa certos limites à qualidade dos espectros que posso obter "de uma só vez". No entanto, para muitas aplicações, é perfeitamente válido especificar um procedimento de aquisição que diga que sempre medições repetidas devem ser tomadas e calculadas a média. Por outro lado, se o aplicativo for analítico em tempo real / online ou em linha , como a FIA (análise de injeção de fluxo), isso implica restrições em possíveis esquemas de agregação.
fonte
Em uma configuração de regressão, você pode realmente testar se a agregação simples é a escolha correta. Suponha que você tenha dados mensais dados diários X τ (com os m dias fixos em um mês). Suponha que você esteja interessado em uma regressão:Yt Xτ m
onde
com
Em uma configuração sem regressão, há resultados que mostram que a agregação pode alterar as propriedades da série temporal. Por exemplo, se você agregar processos AR (1) com memória de curto prazo (a correlação entre duas observações da série temporal desaparece rapidamente quando a distância entre elas aumenta), é possível obter um processo com memória de longo prazo.
Portanto, para resumir a resposta, a validade da aplicação das estatísticas nos dados agregados é uma questão estatística. Dependendo do modelo, é possível construir uma hipótese, seja uma aplicação válida ou não.
fonte