Estou tentando gerar conjuntos de variáveis aleatórias causalmente conectadas e comecei a fazer isso com uma abordagem de monte carlo.
A linha de base é um histograma medido bidimensional a partir do qual eu desenho valores aleatórios.
Nos meus exemplos concretos destas variáveis são a aceleração e velocidade - então obviamente tem que segurar.v v i + 1 = v i + um i * d t
Minha atual abordagem ingênua é:
Eu começo com um pouco de . Então eu gere um aleatório de acordo com a probabilidade medida de para o valor de . Usando este , posso calcular a e todo o procedimento é iniciado novamente.aa v 0 a 0 v 1
Então, quando eu checo as acelerações geradas nos compartimentos de tudo está bem. Mas eu obviamente isso não respeita a distribuição marginal de .v v
Eu estou familiarizado com os métodos básicos de monte carlo, embora não possua uma base teórica, como você pode imaginar. Eu ficaria bem se as duas variáveis fossem conectadas apenas por alguma matriz de correlação, mas a conexão causal entre as duas me desse dor de cabeça.
Não consegui encontrar um exemplo para esse tipo de problema em algum lugar - posso estar pesquisando os termos errados. Ficaria satisfeito se alguém pudesse me indicar alguma literatura / exemplo ou método promissor para entender isso.
(Ou me diga que isso não é realmente possível, dadas as minhas informações - é o que eu acho que ocasionalmente ...)
EDITAR:
O objetivo real de todo esse procedimento: eu tenho um conjunto de medidas e , representadas em um histograma bidimensional . Dada essa entrada, gostaria de gerar conjuntos aleatórios de e que reproduzem a distribuição medida.v N ( a , v ) a r v r
fonte
Respostas:
Parece que, para reproduzir a distribuição conjunta , você deve selecionar new não apenas com base em , mas com base na antiga também:a v aρ(a,v) a v a
A questão (para a qual ainda não sei a resposta) é como encontrar que produz . ρρ′ ρ
UPD: Você deve resolver a seguinte equação integral:
Aproximando a função com um histograma, você transforma isso em um sistema de equações lineares:ρ
Este sistema é subdeterminado. Você pode aplicar uma penalidade de suavidade para obter uma solução.
fonte
Os dados do GPS não contêm a posição ? Eu pensaria que, não só depende de e mas também depende de . Considere: em qualquer rede de estradas, existem gargalos, limites de velocidade, sinais, cruzamentos, declives acentuados etc. que são geolocalizados. Então, algo como um conjunto (distribuição) definido por:v i + 1 v i a i a i + 1 p ip vi+1 vi ai ai+1 pi
v i + 1 = v i + a i d tFa=Pr(Ai+1≤ai+1 | ai,vi,pi)
vi+1=vi+aidt
Para esse conjunto, a dificuldade estará na natureza dos dados. É provável que a população real seja assimétrica, não linear (por partes) e pode não ter momentos definidos. Essas características podem não ser evidentes na amostra que você tem em mãos.
Como o @whuber afirmou, o problema, ou seja, exatamente o que você está procurando produzir, ainda não parece completo e claramente definido. Não está claro se você está interessado no conjunto ou mais do que nos indivíduos.
fonte