Uma maneira de resumir a comparação de duas curvas de sobrevivência é calcular a taxa de risco (FC). Existem (pelo menos) dois métodos para calcular esse valor.
- Método Logrank. Como parte dos cálculos de Kaplan-Meier, calcule o número de eventos observados (mortes, geralmente) em cada grupo ( e ), e o número de eventos esperados, assumindo uma hipótese nula de que não há diferença na sobrevivência ( e ) . A taxa de risco então é:
- Método de Mantel-Haenszel. Primeiro calcule V, que é a soma das variações hipergeométricas em cada momento. Em seguida, calcule a taxa de risco como:
obtive ambas as equações do capítulo 3 de Machin, Cheung e Parmar, Survival Analysis . Esse livro afirma que os dois métodos geralmente fornecem métodos muito semelhantes e, de fato, esse é o caso do exemplo do livro.
Alguém me enviou um exemplo em que os dois métodos diferem por um fator de três. Neste exemplo em particular, é óbvio que a estimativa de logrank é sensata e a estimativa de Mantel-Haenszel está distante. Minha pergunta é se alguém tem algum conselho geral sobre quando é melhor escolher a estimativa de logrank da taxa de risco e quando é melhor escolher a estimativa de Mantel-Haenszel? Isso tem a ver com o tamanho da amostra? Número de gravatas? Proporção de tamanhos de amostra?
Respostas:
Acho que descobri a resposta (para minha própria pergunta). Se a suposição de riscos proporcionais for verdadeira, os dois métodos fornecem estimativas semelhantes da taxa de risco. A discrepância que encontrei em um exemplo em particular, agora penso, se deve ao fato de essa suposição ser duvidosa.
Se a suposição de riscos proporcionais for verdadeira, um gráfico de log (tempo) vs. log (-log (St)) (onde St é a sobrevivência proporcional no tempo t) deve mostrar duas linhas paralelas. Abaixo está o gráfico criado a partir do conjunto de dados do problema. Parece longe de ser linear. Se a suposição de riscos proporcionais não for válida, o conceito de uma taxa de risco não terá sentido e, portanto, não importa qual método é usado para calcular a taxa de risco.
Gostaria de saber se a discrepância entre as estimativas de logrank e Mantel-Haenszel da taxa de risco pode ser usada como um método para testar a suposição de riscos proporcionais?
fonte
Se não me engano, o estimador de log-rank a que você se refere também é conhecido como estimador de Pike. Eu acredito que é geralmente recomendado para RH <3, porque exibe menos viés nesse intervalo. O documento a seguir pode ser interessante (observe que o documento se refere a ele como O / E):
fonte
Na verdade, existem vários outros métodos e a escolha geralmente depende se você está mais interessado em procurar diferenças iniciais, diferenças posteriores ou - como no teste de log-rank e no teste de Mantel-Haenszel - atribuem peso igual a todos os pontos no tempo.
Para a pergunta em questão. O teste log-rank é de fato uma forma do teste de Mantel-Haenszel aplicado aos dados de sobrevivência. O teste de Mantel-Haenszel é geralmente usado para testar a independência em tabelas de contingência estratificadas.
Se tentarmos aplicar o teste MH aos dados de sobrevivência, podemos começar assumindo que os eventos a cada momento de falha são independentes. Em seguida, estratificamos por tempo de falha. Utilizamos os métodos MH para tornar cada tempo de falha um estrato. Não surpreendentemente, eles geralmente dão o mesmo resultado.
A exceção ocorre quando mais de um evento ocorre simultaneamente - várias mortes exatamente no mesmo momento. Não me lembro como o tratamento difere. Penso que o teste de log-rank calcula a média dos possíveis pedidos dos tempos de falha vinculados.
Portanto, o teste log-rank é o teste MH para dados de sobrevivência e pode lidar com laços. Eu nunca usei o teste MH para dados de sobrevivência.
fonte
Eu pensei que tinha encontrado um site e referência que lida exatamente com esta pergunta:
http://www.graphpad.com/faq/viewfaq.cfm?faq=1226 Comece em "Os dois métodos comparados".
O site faz referência ao artigo de Berstein que está vinculado (acima):
http://www.jstor.org/stable/2530564?seq=1
O site resume muito bem os resultados de Berstein e cols.
O site também se refere ao conjunto de dados no qual "as duas estimativas de FC eram muito diferentes (por um fator de três)" e sugere que a suposição de PH é uma consideração importante.
Então pensei: "Quem foi o autor do site?" Depois de um pouco de pesquisa, descobri que era Harvey Motulsky. Então Harvey, eu consegui fazer referência a você para responder sua própria pergunta. Você se tornou a autoridade!
O "conjunto de dados do problema" é um conjunto de dados disponível ao público?
fonte