Estou trabalhando extensivamente com modelos de séries temporais financeiras, principalmente AR (I) MA e Kalman.
Um problema que continuo enfrentando é a frequência de amostragem. Inicialmente, eu pensava que, se fosse oferecida a possibilidade de amostrar com mais frequência a partir de um processo subjacente, eu deveria amostrar com a maior frequência possível, para que eu tenha um número muito maior de amostras; portanto, os parâmetros do meu modelo terão menos variação.
Na realidade, essa idéia não acabou sendo boa. O que aconteceu é que, se o processo subjacente não estiver exibindo variação suficiente, aumentar a frequência de amostragem significa realmente obter muitos (mesmos) valores repetidos. E a construção de um modelo com base nesses valores resulta em modelos com coeficientes de modelo muito pequenos que não prevêem bem no futuro (é claro que a definição de "poço" é subjetiva e o aumento da frequência requer a previsão de muito mais etapas de amostra no futuro para atingir o mesmo intervalo de tempo em uma configuração de frequência mais baixa). O modelo aprende o que encontra mais - uma linha plana.
Eu queria fazer uma abordagem de amostragem adaptativa, ou seja, amostrar com mais frequência quando houver variação e com menos frequência quando não houver. Isso não é fácil, no entanto. Antes de tudo, não está claro que tipo de viés estou introduzindo ao fazê-lo (e será diferente dependendo de como eu acionar a amostra / pular). Em segundo lugar, modelos de séries temporais como o ARIMA não são adequados para etapas de amostra desiguais.
Existe uma boa maneira de lidar com esse problema? Também me faz pensar como é possível obter uma transição perfeita entre modelos de tempo contínuos e modelos de tempo discretos, se os modelos são tão dramaticamente afetados pela frequência de amostragem (especialmente quando os intervalos de tempo ficam cada vez menores)? Qualquer indicação de recursos externos também será apreciada.
obrigado
fonte
Respostas:
Os ARIMA podem não ser adequados ao seu objetivo, mas os modelos de espaço de estado são: você pode experimentar quantas vezes quiser (e, em princípio, quanto melhor) e executar uma atualização temporal em intervalos fixos, conforme a dinâmica do seu processo assumido. pode exigir. Uma das belezas dos modelos de espaço de estado é que o processo de observação é separado do processo do modelo e intervalos de tempo separados podem ser usados para cada um.
fonte
Gostaria de apontar para o artigo
Ghysels, E, P. Santa-Clara e R. Valkanov (2006): "Prevendo a volatilidade: aproveitando ao máximo os dados de retorno amostrados em diferentes frequências", Journal of Econometrics, vol. 131, pp. 59-95.
Os autores empregam uma técnica chamada MIDAS (amostragem de dados mistos) por si mesmos, a fim de comparar estimativas de volatilidade com base em dados amostrados em diferentes frequências. É certo que isso não é exatamente o que você estava procurando, mas os autores afirmam que sua técnica é adequada para comparar os resultados de maneira significativa. Talvez isso ofereça pelo menos uma segunda maneira de analisar seus dados. Parece que, em particular no campo da macroeconomia, essa abordagem ganhou algum interesse.
fonte
Isso poderia funcionar na amostra, mas seria difícil de usar para previsões fora da amostra, a menos que você descubra como prever a própria variabilidade (e isso não precisa ser impossível). Além disso, se você encontrar regimes com baixa variação (ou nenhuma variação) seguidos por regimes de alta variação, naturalmente precisará de modelos separados para os dois; ter um modelo para todo o processo e amostrar em intervalos / frequências desiguais pareceria intuitivamente abaixo do ideal. Você mencionou modelos de mudança de regime (ao responder meu comentário), e essa é uma boa ilustração do que você pode precisar aqui.
Isso não é inteiramente verdade. Em uma configuração de série temporal, geralmente é o período de tempo, e não o número de observações que importa. Por exemplo, 120 observações mensais (abrangendo 10 anos) são uma amostra mais informativa do que 209 observações semanais (abrangendo 4 anos) ao testar a presença de uma raiz unitária; veja este Dave Giles' post e a última referência nele. Ou considere um caso limitador em que você faz uma amostragem com tanta frequência que essencialmente mede a mesma coisa várias vezes. Isso aumentaria o tamanho da amostra, mas não traria novas informações, levando a uma impressão espúria da precisão da estimativa. Então, talvez você não deva gastar muito tempo aumentando a frequência de amostragem e construindo alguns modelos correspondentes?
fonte