A partir de uma resposta em uma pergunta anterior , fui direcionado para a sequência de Halton, para criar um conjunto de vetores que cobria um espaço de amostra uniforme de maneira bastante uniforme. Mas a página da wikipedia menciona que números primos mais altos são geralmente altamente correlacionados no início da série. Esse parece ser o caso de qualquer par de números primos altos com um tamanho de amostra relativamente curto - e mesmo quando as variáveis não estão correlacionadas, o espaço da amostra não é amostrado uniformemente, mas existem faixas diagonais de alta densidade amostral no espaço .
Como estou usando vetores de comprimento 6 ou mais, inevitavelmente precisarei usar alguns números primos para os quais isso é um problema (embora não seja tão ruim quanto no exemplo acima), e alguns pares de variáveis serão amostrados de maneira não uniforme em seu plano de amostra. Usar a sequência de Sobol para gerar um conjunto semelhante me parece (apenas olhando para gráficos) gerar amostras entre pares de variáveis que são distribuídas de maneira muito mais uniforme, mesmo para um número relativamente pequeno de amostras. Isso parece muito mais útil, e estou me perguntando quando uma sequência de Halton seria mais benéfica. Ou é apenas mais fácil calcular a sequência de Halton?
Nota: a discussão de outras seqüências multidimensionais de baixa discrepância também é bem-vinda.
fonte