Nos algoritmos de motivo de rede, parece bastante comum retornar um valor p e um escore Z para uma estatística: "A rede de entrada contém X cópias do subgrafo G". Um subgráfico é considerado um motivo se satisfizer
- valor p <A,
- Escore Z> B e
- X> C, para alguns A, B e C. definidos pelo usuário (ou definidos pela comunidade)
Isso motiva a pergunta:
Pergunta : Quais são as diferenças entre o valor p e o escore Z?
E a subquestão:
Pergunta : Existem situações em que o valor p e o escore Z da mesma estatística podem sugerir hipóteses opostas? As primeira e segunda condições listadas acima são essencialmente as mesmas?
fonte
Um escore descreve seu desvio da média em unidades de desvio padrão. Não está explícito se você aceita ou rejeita sua hipótese nula.Z
Um valor- é a probabilidade de que, sob a hipótese nula, possamos observar um ponto tão extremo quanto sua estatística. Isso explicitamente indica se você rejeita ou aceita sua hipótese nula, considerando um tamanho de teste .p α
Considere um exemplo em que e a hipótese nula é . Então você observa . Seu escore é 5 (que apenas indica a que distância você se desvia da hipótese nula em termos de ) e seu valor é 5,733e-7. Para 95% de confiança, você terá um tamanho de teste e, como , rejeitará a hipótese nula. Mas, para qualquer estatística, deve haver alguns equivalentes e modo que os testes sejam os mesmos.X∼N(μ,1) μ=0 x1=5 Z σ p α=0.05 p<α A B
fonte
zp Valor- indica quão improvável é a estatística. -score indica a que distância está da média. Pode haver uma diferença entre eles, dependendo do tamanho da amostra.z
Para amostras grandes, até pequenos desvios da média se tornam improváveis. Ou seja, o valor pode ser muito pequeno, mesmo para um baixo score. Por outro lado, para amostras pequenas, mesmo desvios grandes não são improváveis. Ou seja, um grande escore não significa necessariamente um pequeno valor .z z pp z z p
fonte