A sobreposição entre duas amostras de expressão gênica é significativa?

8

Realizei um experimento para estudar a resposta de uma levedura (que contém 5.000 genes) ao estresse causado por choque térmico. Eu tenho uma lista de 48 genes superexpressos a 37ºC e outra lista de 145 genes superexpressos a 42ºC. Existem 38 genes que são superexpressos em ambos.

Por acaso, esperava apenas um gene superexpresso em ambos, como posso calcular se a sobreposição que obtive é significativamente? Como posso obter o valor de ? Não sei nada sobre software bioestatístico ou matemático. Muito obrigado !!! Qualquer ajuda será muito bem-vinda :)p

Laura
fonte
Você pode construir um diagrama de Venn para exibir a sobreposição.
Michael R. Chernick 04/07
Mas como posso calcular o valor de p?
Laura
Um valor p é sempre calculado em relação a uma hipótese. Qual é a hipótese que você deseja investigar aqui? Que genes diferentes são superexpressos a diferentes temperaturas?
MånsT
A hipótese é que os genes superexpressos a 37ºC também sejam superexpressos a 42ªC. E parece que poderia ser o caso, porque 38 genes (de 48 genes no total) estão superexpressos tanto a 37ºC quanto a 42ºC.
Laura
Essa não é uma hipótese estatística que possa ser testada. Eu não acho que você está procurando valores-p. Eu acho que você quer medir o grau de sobreposição.
22460 Michael Jackson Chernick

Respostas:

4

A tabela fica assim

                37 deg C
42 deg C     yes      no
yes          38       97
no           10      4855

sim e não se referem a casos superexpressos ou não, eu executei o teste exato de Fisher no SAS A saída é colada abaixo:

Laura Gene expression data 


The FREQ Procedure


Statistics for Table of Group by expressed

Fisher's Exact Test 
Cell (1,1) Frequency (F) 4855 
Left-sided Pr <= F 1.0000 
Right-sided Pr >= F 4.776E-53 

Table Probability (P) 8.132E-51 
Two-sided Pr <= P 4.776E-53 
Sample Size = 5000

Você vê aqui que o valor de p para o teste exato de Fisher é muito pequeno, muito menor que 0,0001.

Isso mostra exatamente o que você declarou que os 38 observados superexpressos em ambas as temperaturas são muito maiores do que o que você esperaria sob independência, que, como você afirmou, seria 1,296.

Michael R. Chernick
fonte
3

O teste exato mencionado por Michael é provavelmente o modo que eu recomendaria usar para resolver o problema (menos suposições). Para referência, o teste estatístico comum correspondente seria um teste de independência .χ2

russellpierce
fonte
1
O teste do qui-quadrado também é não paramétrico, mas requer teoria assintótica. O teste de Fisher tem uma suposição extra de margens fixas que o quadrado do qui e outros testes da tabela de contingência não assumem.
Michael R. Chernick 04/07
@ Laura Você teve um problema de teste bem definido. Lamento que tenha sido necessário muito debate para encontrá-lo.
Michael R. Chernick 04/07
Muito obrigado Michael! Agora eu sei o teste que tenho que usar e como inserir os dados. Apenas mais duas pequenas perguntas: Existe alguma calculadora exata de teste Fischer online? Porque eu não tenho SAS e gostaria de calcular mais valor de p. E na sua tabela qual é o valor de p que tenho que considerar? Talvez a probabilidade de dois lados? Obrigado novamente!!! :)
Laura
1
Laura ... vá com o Pr dois lados. quantitativeskills.com/sisa/statistics/fishrhlp.htm (link "vá para o procedimento"). A calculadora on-line não possui fidelidade para fornecer um valor-p tão baixo.
russellpierce