Quais são os prós e os contras do uso do método logrank vs. Mantel-Haenszel para calcular a taxa de risco na análise de sobrevivência?

17

Uma maneira de resumir a comparação de duas curvas de sobrevivência é calcular a taxa de risco (FC). Existem (pelo menos) dois métodos para calcular esse valor.

  • Método Logrank. Como parte dos cálculos de Kaplan-Meier, calcule o número de eventos observados (mortes, geralmente) em cada grupo ( e ), e o número de eventos esperados, assumindo uma hipótese nula de que não há diferença na sobrevivência ( e ) . A taxa de risco então é: OumaObEumaEb
    HR=(Ouma/Euma)(Ob/Eb)
  • Método de Mantel-Haenszel. Primeiro calcule V, que é a soma das variações hipergeométricas em cada momento. Em seguida, calcule a taxa de risco como: obtive ambas as equações do capítulo 3 de Machin, Cheung e Parmar, Survival Analysis . Esse livro afirma que os dois métodos geralmente fornecem métodos muito semelhantes e, de fato, esse é o caso do exemplo do livro.
    HR=exp((Ouma-Euma)V)

Alguém me enviou um exemplo em que os dois métodos diferem por um fator de três. Neste exemplo em particular, é óbvio que a estimativa de logrank é sensata e a estimativa de Mantel-Haenszel está distante. Minha pergunta é se alguém tem algum conselho geral sobre quando é melhor escolher a estimativa de logrank da taxa de risco e quando é melhor escolher a estimativa de Mantel-Haenszel? Isso tem a ver com o tamanho da amostra? Número de gravatas? Proporção de tamanhos de amostra?

Harvey Motulsky
fonte
Como essas estimativas se relacionam com a dada pela regressão de Cox? Esse deve ser o padrão-ouro para estimar o RH.
Aniko
O modelo de Cox incorpora covariáveis. Os métodos de Kaplan-Meier, Nelson-Aalen, Mantel-Haenszel modelam o perigo em função apenas da idade.
21810 shabbychef
@shabbychef: com Cox PH, use uma única covariável binária, ou seja, codifique 0/1 para grupos de referência / comparação e exp (beta) = HR.
ars
O log-rank é um teste mais poderoso que o Cox PH quando a suposição de Riscos proporcionais é satisfeita. Portanto, com uma única covariável de dois níveis, é preferível um teste de log-rank ou Mantel-Haenszel.
Thylacoleo
veja abaixo a resposta ...
Thylacoleo

Respostas:

11

Acho que descobri a resposta (para minha própria pergunta). Se a suposição de riscos proporcionais for verdadeira, os dois métodos fornecem estimativas semelhantes da taxa de risco. A discrepância que encontrei em um exemplo em particular, agora penso, se deve ao fato de essa suposição ser duvidosa.

Se a suposição de riscos proporcionais for verdadeira, um gráfico de log (tempo) vs. log (-log (St)) (onde St é a sobrevivência proporcional no tempo t) deve mostrar duas linhas paralelas. Abaixo está o gráfico criado a partir do conjunto de dados do problema. Parece longe de ser linear. Se a suposição de riscos proporcionais não for válida, o conceito de uma taxa de risco não terá sentido e, portanto, não importa qual método é usado para calcular a taxa de risco.

texto alternativo

Gostaria de saber se a discrepância entre as estimativas de logrank e Mantel-Haenszel da taxa de risco pode ser usada como um método para testar a suposição de riscos proporcionais?

Harvey Motulsky
fonte
7

Se não me engano, o estimador de log-rank a que você se refere também é conhecido como estimador de Pike. Eu acredito que é geralmente recomendado para RH <3, porque exibe menos viés nesse intervalo. O documento a seguir pode ser interessante (observe que o documento se refere a ele como O / E):

... método para todos, exceto os maiores ensaios. O método Mantel-Haenszel é minimamente tendencioso, fornece respostas muito próximas às obtidas com a LMC e pode ser usado para fornecer intervalos aproximados satisfatórios de confiança.

ars
fonte
Tendo examinado brevemente esse artigo, não tenho certeza de que as estimativas que consideram sejam as mesmas das equações do questionador. Concordo com os comentários da pergunta - talvez em 1981 os métodos aproximados tenham sido úteis, mas atualmente não há razão óbvia para não usar a regressão de Cox.
onestop 20/08/10
@ onestop: hmm, pense na definição de O / E == LR com o log esquecido acima? Concordo com o que você diz sobre Cox PH - essa não é a pergunta que eu estava tentando responder, mas seu conselho é melhor no contexto mais amplo.
ars
Bernstein et. al. mostre alguns motivos (pequenos n, laços) que fazem com que os dois métodos sejam imprecisos ou diferentes. Mas todas as discrepâncias que eles mostraram são pequenas. Portanto, acho que nada neste artigo explica a discrepância em três partes que vi que levou a essa pergunta. Veja abaixo a resposta que eu criei.
Harvey Motulsky
7

Na verdade, existem vários outros métodos e a escolha geralmente depende se você está mais interessado em procurar diferenças iniciais, diferenças posteriores ou - como no teste de log-rank e no teste de Mantel-Haenszel - atribuem peso igual a todos os pontos no tempo.

Para a pergunta em questão. O teste log-rank é de fato uma forma do teste de Mantel-Haenszel aplicado aos dados de sobrevivência. O teste de Mantel-Haenszel é geralmente usado para testar a independência em tabelas de contingência estratificadas.

Se tentarmos aplicar o teste MH aos dados de sobrevivência, podemos começar assumindo que os eventos a cada momento de falha são independentes. Em seguida, estratificamos por tempo de falha. Utilizamos os métodos MH para tornar cada tempo de falha um estrato. Não surpreendentemente, eles geralmente dão o mesmo resultado.

A exceção ocorre quando mais de um evento ocorre simultaneamente - várias mortes exatamente no mesmo momento. Não me lembro como o tratamento difere. Penso que o teste de log-rank calcula a média dos possíveis pedidos dos tempos de falha vinculados.

Portanto, o teste log-rank é o teste MH para dados de sobrevivência e pode lidar com laços. Eu nunca usei o teste MH para dados de sobrevivência.

Thylacoleo
fonte
3

Eu pensei que tinha encontrado um site e referência que lida exatamente com esta pergunta:

http://www.graphpad.com/faq/viewfaq.cfm?faq=1226 Comece em "Os dois métodos comparados".

O site faz referência ao artigo de Berstein que está vinculado (acima):

http://www.jstor.org/stable/2530564?seq=1

O site resume muito bem os resultados de Berstein e cols.

Os dois geralmente dão resultados idênticos (ou quase idênticos). Mas os resultados podem diferir quando vários indivíduos morrem ao mesmo tempo ou quando a taxa de risco está longe de 1,0.

Bernsetin e colegas analisaram dados simulados com os dois métodos (1). Em todas as suas simulações, a suposição de riscos proporcionais era verdadeira. Os dois métodos deram valores muito semelhantes. O método logrank (ao qual eles se referem como o método O / E) relata valores mais próximos de 1,0 do que a verdadeira taxa de risco, especialmente quando a taxa de risco é grande ou o tamanho da amostra é grande.

Quando existem laços, ambos os métodos são menos precisos. Os métodos de logrank tendem a relatar índices de risco ainda mais próximos de 1,0 (portanto, o índice de risco relatado é muito pequeno quando o índice de risco é maior que 1,0 e muito grande quando o índice de risco é menor que 1,0). O método Mantel-Haenszel, por outro lado, relata índices de risco que estão além de 1,0 (portanto, o índice de risco relatado é muito grande quando a taxa de risco é maior que 1,0 e muito pequeno quando a taxa de risco é menor que 1,0).

Eles não testaram os dois métodos com dados simulados, onde a suposição de riscos proporcionais não é verdadeira. Vi um conjunto de dados em que as duas estimativas de FC eram muito diferentes (por um fator de três), e a suposição de riscos proporcionais era duvidosa para esses dados. Parece que o método de Mantel-Haenszel dá mais peso às diferenças no risco em momentos tardios, enquanto o método de logrank dá peso igual em todos os lugares (mas eu não o explorei em detalhes). Se você observar valores de FC muito diferentes com os dois métodos, pense se a suposição de riscos proporcionais é razoável. Se essa suposição não for razoável, é claro que todo o conceito de uma única taxa de risco que descreve toda a curva não é significativo

O site também se refere ao conjunto de dados no qual "as duas estimativas de FC eram muito diferentes (por um fator de três)" e sugere que a suposição de PH é uma consideração importante.

Então pensei: "Quem foi o autor do site?" Depois de um pouco de pesquisa, descobri que era Harvey Motulsky. Então Harvey, eu consegui fazer referência a você para responder sua própria pergunta. Você se tornou a autoridade!

O "conjunto de dados do problema" é um conjunto de dados disponível ao público?

Thylacoleo
fonte
Eu descobri a resposta há dois dias e publiquei aqui como uma nova resposta. Também expandi e atualizei a página da web em graphpad.com que você encontrou. Acabei de editar essa página novamente para incluir um link para um arquivo do Excel com os dados do problema ( graphpad.com/faq/file/1226.xls ). Eu não poderia fazer isso até obter permissão do cara que gerou os dados (ele quer ser anônimo e os dados são vagamente rotulados).
Harvey Motulsky