O que uma caminhada aleatória faz exatamente?

8

Para ser sincero, li muitos sites e respostas sobre esta questão, e nenhum explicou em palavras simples que são compreensíveis. O que eu quero fazer é entender o que uma caminhada aleatória faz e como ela pode ser usada para a Análise de Enriquecimento de Conjunto de Genes.

Existe um artigo publicado aqui http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3205944/ no entanto, eu realmente não conseguia entender.

Alguém pode explicar o que faz em palavras simples?

Aprendiz
fonte
2
Essas são duas perguntas muito diferentes!
Alexis
1
@ Alexis Aceitei sua revisão, espero que agora esteja claro!
Learner
1
@Nemo Eu removi tags não relacionadas e adicionei tags de séries temporais . Sinta-se à vontade para editar minhas alterações ou adicionar tags adicionais, mas tags como r , significância estatística ou matemática parecem não relacionadas aqui.
Tim

Respostas:

11

Vou tentar responder sua primeira pergunta

Uma caminhada aleatória é uma série de medidas em que o valor em qualquer ponto da série é o valor do ponto anterior da série mais alguma quantidade aleatória.

Por exemplo, suponha que você jogue uma moeda justa em uma série de lançamentos, e toda vez que a moeda aparecer, você adiciona 1 ao valor anterior da sua variável serial e toda vez que a moeda aparece, você subtrai 1 do valor anterior da sua variável serial. Se o valor inicial for 0 e se você virar a seguinte sequência de lançamentos de moedas:

T H T T T H H H T T H T H T H

O passeio aleatório , base nesses valores, conforme descrito acima, seria:y

0 -1 0 -1 -2 -3 -2 -3 -1 -2 -2 -1 -2 -1 -2 -1

Portanto, o valor de é:y

yt=yt1+2Bernoulli(0.5)1

A distribuição de depende do tempo , fornecendo algumas propriedades interessantes para uma amostra de em diferentes momentos:t yyty

  1. A média de é indefinida. yIsso pode parecer contra-intuitivo, pois você pode esperar que as cabeças e as coroas de uma moeda equilibrada estejam centradas no zero. Isso é verdade até o momento, mas zero era apenas um valor inicial arbitrário de . Portanto, não há meio real!yy

  2. A variância de . y=tÀ medida que o tempo (o número de inversões) aumenta, a variação também aumenta. Por exemplo, no primeiro flip ( ), os valores possíveis são ou e, na verdade, a variação é 1. Mas no segundo flip ( ) os valores possíveis são , ou , e a variação é igual a 2. Para um número infinito de inversões (em , quando o intervalo de todos os valores possíveis de passa de a ), a variação é infinita.1 - 1 t = 2 2 0 - 2 t = y - t=111t=2202t=y

Esses dois fatos causam estragos ao tentar extrair inferências sobre a distribuição de (em vez de para um determinado ) dado apenas uma amostra ao usar as ferramentas básicas da inferência estatística. (Como uma estimativa finita de indefinida ? Como uma estimativa finita de estimar ?)y t y 0yyty0 s 2 y σ 2 y =y¯sy2σy2=

Existem muitos tipos de caminhada aleatória e, de maneira mais geral, de processo autogregressivo (ou seja, qualquer variável que dependa de alguma forma de seus valores anteriores). O exemplo aqui usa uma variável aleatória simples de Bernouli (o sorteio), mas pode-se:

  • adicione um valor aleatório normalmente distribuído a valores sucessivos de vez disso ... ou mesmo um valor aleatório retirado de qualquer tipo de distribuição;y
  • faça com que o valor de em algum momento dependa dos valores anteriores de em mais de um ponto no tempo (por exemplo, );y y t = y t - 1 + y t - 2 + Algo aleatórioyyyt=yt1+yt2+Something Random
  • emparelhe o valor de com um valor aleatório de para criar uma caminhada aleatória bidimensional;xyx
  • faça de alguma função sofisticada de , um exemplo simples é , em que , significando que a memória de qualquer momento específico de decai ao longo do tempo (com a memória durando mais tempo é 1) - pelos comentários de Alecos, isso seria simplesmente 'auto-regressivo' (uma caminhada aleatória pura teria ); y t - 1 y t = α y t - 1 + Algo Aleatório | α | < 1 ano | α | | α | = 1ytyt1yt=αyt1+Something Random|α|<1y |α||α|=1
  • faça muitas outras coisas para tornar as caminhadas aleatórias e / ou processos autorregressivos mais complexos.

Mas eles são todos os Dickens a tentar analisar usando os métodos básicos. É por isso que temos modelos de regressão e correção de erros cointegrados e outras técnicas de análise de séries temporais para lidar com esse tipo de dados (que às vezes chamamos de 'não integrado', 'memorizado há muito tempo' ou 'raiz da unidade' entre outros rótulos). , dependendo dos detalhes).

A origem do termo "passeio aleatório" é de um par de cartas muito breves para a Natureza em 1905.

Referências
Pearson, K. (1905). Cartas ao Editor: O problema da caminhada aleatória. Nature , 72 (1865): 294.

Pearson, K. (1905). Cartas ao Editor: O problema da caminhada aleatória. Nature , 72 (1867): 342.

Alexis
fonte
2
Você escreve "Uma caminhada aleatória é uma série de medidas nas quais o valor em qualquer ponto da série depende dos valores dos pontos anteriores da série". Mas isso descreve qualquer processo autoregressivo, e nem todos os processos autoregressivos são passeios aleatórios. Como obviamente você conhece o assunto, acredito que seria útil se você revisasse essa afirmação para trazer à superfície quais são as características únicas de uma caminhada aleatória.
Alecos Papadopoulos
@AlecosPapadopoulos TY! Por favor, me ajude aqui ... na verdade, não tenho uma profunda familiaridade com o assunto. Como você sugeriria que eu diferenciasse passeios aleatórios de processos autorregressivos?
Alexis
De bom grado. Há uma grande literatura sobre passeios aleatórios, o assunto é muito diversificado. Mas, no primeiro nível, o que distingue uma caminhada aleatória é que todos os valores passados ​​de cada etapa contribuem com seu valor total para o valor atual de sua soma (que é a caminhada aleatória). Em um processo autoregressivo, geralmente o efeito do passado gradualmente desaparece. Você basicamente discute isso em seu post. Agora também reli sua resposta, talvez você queira repensar o uso da palavra "população": cada tem uma distribuição diferente, portanto, em que sentido pertencem à mesma população? y t , y t + 1 . . .ytyt,yt+1...
Alecos Papadopoulos
1
@Nemo Você obtém um tipo específico de comportamento (geralmente ao longo do tempo): o passado determina completamente onde você está - mas o caminho da evolução não afeta onde você será o próximo. Como o processo chegou à sua posição atual, não importa para o futuro.
Alecos Papadopoulos
1
Um passeio aleatório não é realmente "semelhante a um teste de Kolmogorov-Smirnov". Uma derivação da distribuição assintótica da estatística do teste KS sob a hipótese nula usa uma noção relacionada a uma caminhada aleatória. O ponto de desenhar essa conexão parece, no meu rápido olhar, motivar o desenvolvimento na próxima seção (o teste GSEA). Não tenho certeza de que foi uma boa escolha; parece ter levado você a confusão, em vez de ajudá-lo a ver o que estava acontecendo. Sugiro que você tente entender os passeios aleatórios separadamente antes de tentar entender a conexão entre os passeios aleatórios e a GSEA.
Glen_b -Reinstala Monica