Qual teste estatístico deve ser usado para testar o enriquecimento de listas de genes?

10

Realizei um experimento para testar a sensibilidade celular a um determinado agente de dano ao DNA. Descobrimos 270 genes que eram especificamente sensíveis à droga e o número total de genes analisados ​​foi 3668. 38 dos 270 genes sensíveis são classificados como "genes de reparo do DNA". Se o número de "genes de reparo do DNA" contidos no genoma é 112 e o número total de genes no genoma é 3668, os genes sensíveis são enriquecidos nos genes de reparo do DNA? Qual teste estatístico deve ser usado? Eu gostaria que você também pudesse me dizer alguma ferramenta para calcular o valor-p online.

Laura
fonte

Respostas:

17

A prática padrão para testar o enriquecimento de listas de genes é fazer um teste hipergeométrico ou, equivalentemente, um teste exato de Fisher unilateral . Você tem as seguintes tabela de contingência:2×2

Reparação de DNADe outrosSensível38.232270Não sensível74332433981123556

Você pode realizar o teste da Rseguinte maneira:

fisher.test(matrix(c(38,74,232,3324),nrow=2,ncol=2),alternative="greater")

O que fornece um resultado altamente significativo:

Fisher's Exact Test for Count Data

data:  matrix(c(38, 74, 232, 3324), nrow = 2, ncol = 2) 
p-value < 2.2e-16
alternative hypothesis: true odds ratio is greater than 1 
95 percent confidence interval:
5.062107      Inf 
sample estimates:
odds ratio 
7.34918

Note-se que à medida que está a testar para sobre-representação (em vez de sub-representação) o alternativeparâmetro é definido como "greater".

M. Berk
fonte
1
Muito obrigado pela sua resposta. Também achei que o teste exato de Fisher poderia ser um bom método para a análise. Não tenho nenhum software estatístico para executar os resultados para outras classes funcionais que também gostaria de testar. Você conhece alguma ferramenta "online" para obter os valores com todas as casas decimais?
Laura
1
Você pode baixar o R ​​gratuitamente. Veja r-project.org Portanto, não ter software é solúvel (e pensar que você precisa de uma maneira de calcular online está incorreto). Mas faça uma pequena pesquisa para descobrir essas coisas por si mesmo. Consulte o conselho em stats.stackexchange.com/help/how-to-ask para fazer uma boa pergunta.
Nick Cox
@ Nick Seu conselho é bom, mas por favor, não o encaminhe como uma caracterização do pôster: esse fraseado é facilmente compreendido como um ataque, o que duvido que você tenha pretendido. Por isso, removi a frase preliminar do seu comentário (que não adicionou nenhuma informação).
whuber
Uma ótima ferramenta on-line para isso é: mathcelebrity.com/fishers_exact_test.php
Você poderia explicar, adicionalmente, a super-representação do que exatamente está sendo calculado?
Sdgaw erzswer