Por onde começar: Séries temporais desigualmente espaçadas, com muitos valores extremos ou aleatoriedade

8

Realmente não sei o que é possível e gostaria de um ponteiro na direção certa.

Tenho medições de tempo e posição que podem ser qualquer coisa de uma pessoa andando, um veículo na estrada ou em um estacionamento ou uma impressora em um escritório. Preciso calcular os tempos de viagem dos veículos entre dois pontos. Pode ser que eles sigam uma rota sinuosa, ou até demorem dias para ir de A a B. Ou podem ser um veículo para pedestres ou um serviço de emergência.

Quero o tempo estimado de viagem para um veículo normal ao longo da rota principal.

As detecções são sempre que alguém está próximo o suficiente do detector, que possui um raio específico. Às vezes, há muito poucas detecções, o que provavelmente significa que a estrada está vazia e o tempo da viagem seria bom, embora isso possa indicar que a estrada está fechada e o tempo da viagem seria terrível. Ou pode haver muitas detecções que mostram que o tráfego não está se movendo e pode haver fila para sair da estrada, mas outros veículos estão viajando a velocidades normais.

As parcelas parecem ruído aleatório.

EDITAR:

No momento, estou olhando para dois métodos:

  1. Use a faixa interquartil para descartar valores discrepantes
  2. Use um filtro Kalman.

Penso que o filtro está no caminho errado, pois não tenho um modelo para o tempo de viagem, a não ser que, de momento em momento, não espero que mude muito.

Peter Wood
fonte
1
Parece um trabalho que requer um artigo metodológico em Annals of Applied Statistics e um artigo substantivo no Journal of Transportation Research . Você não deve esperar que a comunidade escreva os dois documentos para você nas respostas nem nos comentários e prefere buscar a colaboração de um estatístico ou economista de transportes. Ou jogue isso em um estudante de graduação em estatística ou economia como um tópico de dissertação.
StasK
2
@StasK Eu não esperava que a comunidade escrevesse papéis para mim, pedi dicas na direção certa. Obrigado por me informar que esse é um empreendimento substancial.
Peter Wood
Eu acho que é isso que eu queria dizer. Se você tiver intervalos de tempo desiguais, considere o uso de modelagem de variograma e krigagem, que geralmente são consideradas ferramentas de estatística espacial.
StasK 07/11
@StasK Eu não acho que krigagem e variogramas são o que eu preciso. A geometria da rota entre dois pontos é relativamente desconhecida e sem importância no tipo de resultado que estamos procurando. Temos dois pontos com detecções em cada ponto e muitas detecções de viagens falsas. Queremos filtrar o ruído e obter uma boa estimativa das condições atuais e históricas da estrada. Muito obrigado por seu interesse.
Peter Wood

Respostas:

1

Não sei se posso dar uma resposta esperada, mas acho que alguma abordagem bayesiana seria boa nesse caso.

Você pode querer dar uma olhada nos filtros de partículas em vez do Kalman, pois acho que pode ser um problema configurar o modelo correto para o filtro Kalman nesse caso. Se você quiser usar o Kalman, existem diferentes tipos de filtro e alguns deles exigem um bom conhecimento sobre covariância de erros, o que pode causar problemas, mas alguns podem computá-lo com Mante Carlo. Dê uma olhada no Kalman Filter sem perfume.

Você também pode gostar de http://www.udacity.com/overview/Course/cs373/CourseRev/apr2012 , pois explica algumas dicas básicas sobre a estimativa de veículo em movimento e o carro autônomo do Google. (e está em python).

Talvez mais alguns detalhes em sua pergunta sejam mais úteis e você possa obter respostas mais precisas.

tomasz74
fonte