Eu tenho uma série temporal de medidas (alturas, uma série dimensional). No período de observação, o processo de medição foi interrompido por alguns momentos. Portanto, os dados resultantes são um vetor com NaNs onde houve lacunas nos dados. Usando o MATLAB, isso está me causando um problema ao calcular a autocorrelação ( autocorr
) e aplicar redes neurais ( nnstart
).
Como devem ser tratadas essas lacunas / NaNs? Devo apenas removê-los do vetor? Ou substituir sua entrada por um valor interpolado? (se sim, como no MATLAB)
Existem alguns algoritmos que são imunes a valores ausentes, portanto a solução preferida é procurá-los (por exemplo, Rs
acf
para autocorrelação).Em geral, o caminho a seguir é apenas descartar dados com observações ausentes (pode ser muito doloroso) ou apenas imputar seus valores - a média de vizinhos pode ser suficiente para séries suaves e pequenas lacunas, mas é claro que há inúmeros outros métodos mais poderosos, usando splines, valores aleatórios / mais frequentes, imputação de modelos etc.
fonte
Use a Detecção de intervenção para atribuir os valores ausentes que exploram a estrutura ARIMA útil e quaisquer tendências de horário local e / ou mudanças de nível.
fonte
existem 2 problemas aqui. o primeiro é fornecer uma estrutura numérica significativa para sua resposta de autocorrelação no matlab. para que isso aconteça, você precisa esticar e / ou corrigir a parte da série temporal de seus vetores de dados ... esse componente de "integridade dos dados" do problema é o mais fundamental.
em segundo lugar, você precisa decidir como lidar com o componente 'valor' do seu vetor ... isso depende em grande parte da aplicação específica quanto ao que é melhor assumir (por exemplo, pequenos carimbos de data e hora ausentes e os NaNs correspondentes ou Nulos podem ser interpolados com segurança dos vizinhos ... em intervalos maiores, definir o valor como zero é provavelmente mais seguro ... ou imputar como recomendado acima - obviamente, para que isso seja significativo, os intervalos novamente devem ser comparativamente pequenos.) .
fonte