Para ser sincero, li muitos sites e respostas sobre esta questão, e nenhum explicou em palavras simples que são compreensíveis. O que eu quero fazer é entender o que uma caminhada aleatória faz e como ela pode ser usada para a Análise de Enriquecimento de Conjunto de Genes.
Existe um artigo publicado aqui http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3205944/ no entanto, eu realmente não conseguia entender.
Alguém pode explicar o que faz em palavras simples?
time-series
biostatistics
bioinformatics
Aprendiz
fonte
fonte
Respostas:
Vou tentar responder sua primeira pergunta
Uma caminhada aleatória é uma série de medidas em que o valor em qualquer ponto da série é o valor do ponto anterior da série mais alguma quantidade aleatória.
Por exemplo, suponha que você jogue uma moeda justa em uma série de lançamentos, e toda vez que a moeda aparecer, você adiciona 1 ao valor anterior da sua variável serial e toda vez que a moeda aparece, você subtrai 1 do valor anterior da sua variável serial. Se o valor inicial for 0 e se você virar a seguinte sequência de lançamentos de moedas:
O passeio aleatório , base nesses valores, conforme descrito acima, seria:y
Portanto, o valor de é:y
A distribuição de depende do tempo , fornecendo algumas propriedades interessantes para uma amostra de em diferentes momentos:t yy t y
A média de é indefinida.y Isso pode parecer contra-intuitivo, pois você pode esperar que as cabeças e as coroas de uma moeda equilibrada estejam centradas no zero. Isso é verdade até o momento, mas zero era apenas um valor inicial arbitrário de . Portanto, não há meio real!yy
A variância de .y=t À medida que o tempo (o número de inversões) aumenta, a variação também aumenta. Por exemplo, no primeiro flip ( ), os valores possíveis são ou e, na verdade, a variação é 1. Mas no segundo flip ( ) os valores possíveis são , ou , e a variação é igual a 2. Para um número infinito de inversões (em , quando o intervalo de todos os valores possíveis de passa de a ), a variação é infinita.1 - 1 t = 2 2 0 - 2 t = ∞ y - ∞ ∞t=1 1 −1 t=2 2 0 −2 t=∞ y −∞ ∞
Esses dois fatos causam estragos ao tentar extrair inferências sobre a distribuição de (em vez de para um determinado ) dado apenas uma amostra ao usar as ferramentas básicas da inferência estatística. (Como uma estimativa finita de indefinida ? Como uma estimativa finita de estimar ?)y t y 0y yt y0 s 2 y σ 2 y =∞y¯ s2y σ2y=∞
Existem muitos tipos de caminhada aleatória e, de maneira mais geral, de processo autogregressivo (ou seja, qualquer variável que dependa de alguma forma de seus valores anteriores). O exemplo aqui usa uma variável aleatória simples de Bernouli (o sorteio), mas pode-se:
Mas eles são todos os Dickens a tentar analisar usando os métodos básicos. É por isso que temos modelos de regressão e correção de erros cointegrados e outras técnicas de análise de séries temporais para lidar com esse tipo de dados (que às vezes chamamos de 'não integrado', 'memorizado há muito tempo' ou 'raiz da unidade' entre outros rótulos). , dependendo dos detalhes).
A origem do termo "passeio aleatório" é de um par de cartas muito breves para a Natureza em 1905.
Referências
Pearson, K. (1905). Cartas ao Editor: O problema da caminhada aleatória. Nature , 72 (1865): 294.
Pearson, K. (1905). Cartas ao Editor: O problema da caminhada aleatória. Nature , 72 (1867): 342.
fonte