Outro dia, tive uma consulta com um epidemiologista. Ela é médica com um diploma de saúde pública em epidemiologia e possui muita experiência estatística. Ela orienta seus bolsistas e residentes de pesquisa e os ajuda com questões estatísticas. Ela entende muito bem o teste de hipóteses. Ela teve um problema típico de comparar dois grupos para ver se há uma diferença no risco relacionado à ocorrência de insuficiência cardíaca congestiva (ICC). Ela testou a diferença média na proporção de indivíduos que receberam ICC. O valor de p foi de 0,08. Então, ela também decidiu examinar o risco relativo e obteve um valor-p de 0,027. Então ela perguntou por que um é significativo e o outro não. Observando os intervalos de confiança de 95% nos dois lados para a diferença e a razão, ela viu que o intervalo da diferença média continha 0, mas o limite superior de confiança para a razão era menor que 1. Então, por que obtemos resultados inconsistentes. Minha resposta enquanto tecnicamente correta não foi muito satisfatória. Eu disse: "Essas são estatísticas diferentes e podem dar resultados diferentes. Os valores de p estão na área de importância marginal. Isso pode acontecer facilmente". Acho que deve haver melhores maneiras de responder a isso em termos leigos aos médicos, para ajudá-los a entender a diferença entre testar o risco relativo versus o risco absoluto. Nos estudos epi, esse problema surge muito porque eles costumam observar eventos raros, em que as taxas de incidência de ambos os grupos são muito pequenas e o tamanho da amostra não é muito grande. Estive pensando um pouco sobre isso e tenho algumas idéias que vou compartilhar. Mas primeiro eu gostaria de saber como alguns de vocês lidariam com isso. Sei que muitos de vocês trabalham ou consultam na área médica e provavelmente já enfrentaram esse problema. O que você faria?
fonte
Respostas:
Bem, pelo que você já disse, acho que você já cobriu a maior parte, mas só precisa colocar no idioma dela: um é uma diferença de riscos, um é uma proporção. Portanto, um teste de hipótese pergunta se enquanto o outro pergunta se p 2p2−p1=0 . Às vezes, estes são "próximos" às vezes não. (Feche aspas porque claramente elas não estão próximas no sentido aritmético usual). Se o risco é raro, esses são tipicamente "distantes". por exemplo,002/0,001=2(longe de 1) enquanto0,002-0,001=0,001(próximo a 0); mas se o risco for alto, eles estarão "próximos":.2/.1=2(longe de 0) e.2-.1=.1(também longe de 0, pelo menos em comparação com o caso raro).p2p1=1 .002/.001=2 .002−.001=.001 .2/.1=2 .2−.1=.1
fonte
Lembre-se de que, nos dois testes, você testa uma hipótese completamente diferente com diferentes suposições. Os resultados não são comparáveis, e isso é um erro muito comum.
Em risco absoluto, você testa se a diferença (média) na proporção difere significativamente de zero. A hipótese subjacente no teste padrão para isso assume que as diferenças na proporção são normalmente distribuídas. Isso pode valer para pequenas proporções, mas não para grandes. Tecnicamente, você calcula a seguinte probabilidade condicional:
com e p 2 as duas proporções, e X sua variável de motivos. Isso é equivalente a testar a inclinação b do seguinte modelo:p1 p2 X b
o que equivale a testar a inclinação no seguinte modelo logístico:
A razão pela qual isso faz a diferença é dada na resposta de Peter Flom: uma pequena diferença nos riscos absolutos pode levar a um grande valor para as probabilidades. Portanto, no seu caso, isso significa que a proporção de pessoas infectadas não difere substancialmente, mas as chances de pertencer a um grupo são significativamente maiores do que as chances de pertencer ao outro grupo. Isso é perfeitamente sensato.
fonte
prop.test
(ouchisq.test
como é equivalente no caso 2x2) efisher.test
ficar com mais de 0,005 de diferença. Então eu pergunto que testa ela usou ...