Se eu tiver duas listas A e B, ambas subconjuntos de uma lista C muito maior, como posso determinar se o grau de sobreposição de A e B é maior do que eu esperaria por acaso?
Devo selecionar aleatoriamente elementos de C com os mesmos comprimentos das listas A e B e determinar essa sobreposição aleatória, e fazer isso várias vezes para determinar algum valor-p empírico ou empírico? Existe uma maneira melhor de testar isso?
statistical-significance
Ensopado
fonte
fonte
Respostas:
Para calcular um valor-p, você pode usar este comando R:
Palavra de cautela. Lembre-se de vários testes, ou seja, se você tiver muitas listas A e B , precisará ajustar seus valores-p com uma correção. Por exemplo, as correções de FDR ou Bonferroni.
fonte
A resposta de csgillespie parece correta, exceto por uma coisa: fornece a probabilidade de ver estritamente mais de n_A_B na sobreposição, P (x> n_A_B), mas acho que OP deseja o valor P (x> = n_A_B). Você pode obter o último por
fonte
lower.tail=FALSE
. Valores p muito pequenos (<1e-16) são truncados caso contrário.