Realizei um experimento para estudar a resposta de uma levedura (que contém 5.000 genes) ao estresse causado por choque térmico. Eu tenho uma lista de 48 genes superexpressos a 37ºC e outra lista de 145 genes superexpressos a 42ºC. Existem 38 genes que são superexpressos em ambos.
Por acaso, esperava apenas um gene superexpresso em ambos, como posso calcular se a sobreposição que obtive é significativamente? Como posso obter o valor de ? Não sei nada sobre software bioestatístico ou matemático. Muito obrigado !!! Qualquer ajuda será muito bem-vinda :)
Respostas:
A tabela fica assim
sim e não se referem a casos superexpressos ou não, eu executei o teste exato de Fisher no SAS A saída é colada abaixo:
Você vê aqui que o valor de p para o teste exato de Fisher é muito pequeno, muito menor que 0,0001.
Isso mostra exatamente o que você declarou que os 38 observados superexpressos em ambas as temperaturas são muito maiores do que o que você esperaria sob independência, que, como você afirmou, seria 1,296.
fonte
O teste exato mencionado por Michael é provavelmente o modo que eu recomendaria usar para resolver o problema (menos suposições). Para referência, o teste estatístico comum correspondente seria um teste de independência .χ2
fonte