Scrambling e correlação em sequências de baixa discrepância (Halton / Sobol)

14

Atualmente, estou trabalhando em um projeto no qual gere valores aleatórios usando conjuntos de pontos com baixa discrepância / quase aleatória , como conjuntos de pontos Halton e Sobol. Estes são vetores essencialmente dimensionais que imitam variáveis ​​uniformes dimensionais (0,1), mas têm uma propagação melhor. Em teoria, eles devem ajudar a reduzir a variação de minhas estimativas em outra parte do projeto.dd

Infelizmente, tenho encontrado problemas ao trabalhar com eles e grande parte da literatura neles é densa. Eu esperava, portanto, ter uma ideia de alguém que tenha experiência com eles ou, pelo menos, descobrir uma maneira de avaliar empiricamente o que está acontecendo:

Se você trabalhou com eles:

  • O que exatamente está lutando? E que efeito isso tem no fluxo de pontos gerados? Em particular, há um efeito quando a dimensão dos pontos gerados aumenta?

  • Por que é que, se eu gerar dois fluxos de pontos Sobol com o MatousekAffineOwen, obtendo dois fluxos diferentes de pontos. Por que não é esse o caso quando eu uso a mistura de raiz reversa com pontos Halton? Existem outros métodos de codificação existentes para esses conjuntos de pontos - e, se houver, existe uma implementação do MATLAB?

Se você não trabalhou com eles:

  • Digamos que eu tenho sequênciasn de números supostamente aleatórios, que tipo de estatística devo usar para mostrar que elas não estão correlacionadas? E qual número n eu precisaria para provar que meu resultado é estatisticamente significativo? Além disso, como eu poderia fazer a mesma coisa se tivesse n seqüências S 1 , S 2 , ... , S n devetores d- dimensionais aleatórios [ 0 , 1 ] ?S1,S2,,SnnnS1,S2,,Snd[0 0,1]

Perguntas de acompanhamento sobre a resposta do cardeal

  1. Teoricamente falando, podemos emparelhar qualquer método de embaralhamento com qualquer sequência de baixa disrepany? O MATLAB só me permite aplicar a codificação de seqüência inversa nas seqüências de Halton, e estou pensando se isso é simplesmente um problema de implementação ou de compatibilidade.

  2. Estou procurando uma maneira que me permita gerar duas (t, m, s) redes que não estão correlacionadas. O MatouseAffineOwen me permitirá fazer isso? Que tal se eu usasse um algoritmo de codificação determinístico e simplesmente decidisse escolher cada valor de 'k-ésimo' onde k era primo?

Berk U.
fonte
(t,m,s)(t,m,s)
(t,m,s)PQ{pi}1100{qi}1100{pi}1100{qi}1100{pi}1200{qi}1200
(t,m,s) redes independentemente uma da outra, os conjuntos resultantes serão independentes. Quanto a um algoritmo de embaralhamento determinístico, sem nenhuma noção de aleatoriedade, realmente não pode haver uma noção adequada de correlação. Eu teria que pensar em aceitar entradas pares e ímpares. A abordagem padrão seria obter alguns pontos para o primeiro, gerar e jogar fora muitos outros pontos e coletar seu segundo conjunto de pontos. Isso está relacionado ao uso de conjuntos "queimados" de pontos do QMC.
cardeal

Respostas:

10

(t,m,s)bb=2b

d=2

insira a descrição da imagem aqui

As formas mais básicas de embaralhamento essencialmente permitem a base bn

(t,m,s)(t,m,s)(t,m,s)

Em relação aos tipos de embaralhamento, o embaralhamento com raiz reversa é um embaralhamento determinístico . O algoritmo de embaralhamento de Matousek é um embaralhamento aleatório , feito novamente para manter a propriedade de fechamento. Se você definir a semente aleatória antes de fazer a chamada para a função de embaralhamento, sempre deverá recuperar a mesma rede.

Você também pode estar interessado no projeto MinT .

cardeal
fonte
Muito obrigado por isso. Eu tive algumas perguntas de acompanhamento, se você não se importa. Como a caixa de comentários não me permite listá-las claramente, incluí-as na postagem.
Berk U.