Diferença entre previsões "dentro da amostra" e "pseudo fora da amostra"

12

Existe uma diferença explícita entre previsões dentro da amostra e previsões pseudo fora da amostra . Ambos se destinam ao contexto de avaliação e comparação de modelos de previsão.

altabq
fonte

Respostas:

18

{Yt,Xth}t=h+1Th{1,2,},f^(Xth)YtXthT

Te compare os valores ajustados do modelo com as realizações reais. No entanto, esse procedimento é conhecido por desenhar uma imagem excessivamente otimista da capacidade de previsão do modelo, uma vez que algoritmos comuns de ajuste (por exemplo, usando critérios de erro ao quadrado ou de probabilidade) tendem a se esforçar para evitar grandes erros de previsão e, portanto, são suscetíveis de sobreajuste - ruído incorreto para sinal nos dados.

Uma verdadeira análise fora da amostra seria estimar o modelo com base nos dados até hoje, e construir uma previsão do valor de amanhã YT+1, aguarde até amanhã, registre o erro de previsão eT+1YT+1f^(XT+1h), re-estimate the model, make a new forecast of YT+2, and so forth. At the end of this exercise, one would have a sample of forecast errors {eT+l}l=1L which would be truly out-of-sample and would give a very realistic picture of the model's performance.

Since this procedure is very time-consuming, people often resort to "pseudo", or "simulated", out-of-sample analysis, which means to mimic the procedure described in the last paragraph, using some historical date T0<T, rather than today's date T, as a starting point. The resulting forecasting errors {et}t=T0+1T are then used to get an estimate of the model's out-of-sample forecasting ability.

Note that pseudo-out-of-sample analysis is not the only way to estimate a model's out-of-sample performance. Alternatives include cross-validation and information criteria.

A very good discussion of all these issues is provided in Chapter 7 of

http://www.stanford.edu/~hastie/local.ftp/Springer/OLD/ESLII_print4.pdf

Fabian
fonte
3
O link PDF não funcionar, mas parece ser o livro do Tibshirani livre online "The Elements of Statistical Aprendizagem: Data Mining, inferência e Previsão"
Oleg Melnikov