As curvas de Kaplan-Meier parecem dizer o contrário da regressão de Cox

Em R, estou fazendo análise de dados de sobrevivência de pacientes com câncer.

Eu tenho lido coisas muito úteis sobre análise de sobrevivência no CrossValidated e em outros lugares e acho que entendi como interpretar os resultados da regressão de Cox. No entanto, um resultado ainda me incomoda ...

Estou comparando sobrevivência versus gênero. As curvas de Kaplan-Meier são claramente favoráveis às pacientes do sexo feminino (verifiquei várias vezes se a lenda que acrescentei está correta, a paciente com sobrevida máxima de 4856 dias é realmente uma mulher):

E a regressão de Cox está retornando:

Call:
coxph(formula = survival ~ gender, data = Clinical)

  n= 348, number of events= 154 

              coef exp(coef) se(coef)      z Pr(>|z|)  
gendermale -0.3707    0.6903   0.1758 -2.109    0.035 *
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

           exp(coef) exp(-coef) lower .95 upper .95
gendermale    0.6903      1.449    0.4891    0.9742

Concordance= 0.555  (se = 0.019 )
Rsquare= 0.012   (max possible= 0.989 )
Likelihood ratio test= 4.23  on 1 df,   p=0.03982
Wald test            = 4.45  on 1 df,   p=0.03499
Score (logrank) test = 4.5  on 1 df,   p=0.03396

A razão de gendermalerisco (HR) para pacientes do sexo masculino ( ) é 0,6903. A maneira como eu interpretaria isso (sem olhar para a curva de Kaplan-Meier) é: como a FC é <1, ser paciente do sexo masculino é protetor. Ou, mais precisamente, uma paciente do sexo feminino tem 1 / 0,6903 = exp (-coef) = 1,449 a mais de morrer em um momento específico do que um homem.

Mas isso não parece o que dizem as curvas de Kaplan-Meier! O que há de errado com minha interpretação?

r survival cox-model kaplan-meier francoiskroll
fonte

Pela sua curva de KM, parece que a suposição de PH da regressão de Cox não é válida.

Deep North

Eu vejo. Eu não investiguei isso antes! Graficamente, significa que minhas curvas de Kaplan-Meier devem ser paralelas para que eu possa usar com segurança Cox, certo? Isso parece mais ou menos OK antes de ~ 2200 dias. Tudo bem dar uma olhada nos resultados de Cox para todos os dados um pouco antes da interseção?

francoiskroll

\log - \log {\hat{S}}_{i} (t)

$\log -\log \hat S_i(t)$

{\hat{S}}_{i} (t)

$\hat S_i(t)$

i

$i$

@DeepNorth: Na verdade, não vejo fortes evidências contra riscos proporcionais. Sim, as curvas se sobrepõem tecnicamente ... mas isso é extremo.

Cliff AB

Para complementar as outras respostas e comentários, compare a sobrevida mediana ou a sobrevida em cinco anos para homens e mulheres. Há um benefício claro para os homens nesses dados, de acordo com a análise de PH de Cox.

Itamar

Respostas:

Este é um exemplo muito bom de riscos não proporcionais OU o efeito de 'esgotamento' na análise de sobrevivência. Vou tentar explicar

Primeiro, observe bem sua curva de Kaplan-Meier (KM): você pode ver na primeira parte (até cerca de 3000 dias) a proporção de homens ainda vivos na população em risco no momento t é maior que a proporção de mulheres (ou seja, a linha azul é 'mais alta' que a vermelha). Isso significa que, na verdade, o gênero masculino é 'protetor' para o evento (morte) estudado. Consequentemente, a taxa de risco deve estar entre 0 e 1 (e o coeficiente deve ser negativo).

No entanto, após o dia 3000, a linha vermelha é mais alta! Isso de fato sugere o contrário. Com base apenas neste gráfico de KM, isso sugeriria um risco não proporcional. Nesse caso, 'não proporcional' significa que o efeito da sua variável independente (sexo) não é constante ao longo do tempo. Em outras palavras, a taxa de risco é viável para mudar à medida que o tempo avança. Como explicado acima, este parece ser o caso. O modelo de risco proporcional regular Cox não acomoda tais efeitos. Na verdade, uma das principais suposições é que os riscos são proporcionais! Agora você também pode modelar riscos não proporcionais, mas isso está além do escopo desta resposta.

Há um comentário adicional a ser feito: essa diferença pode dever-se ao fato de os riscos reais serem não proporcionais ouo fato de haver muita variação nas estimativas de cauda das curvas de KM. Observe que, neste momento, o grupo total de 348 pacientes declinou para uma população muito pequena ainda em risco. Como você pode ver, ambos os grupos de gênero têm pacientes que estão passando pelo evento e pacientes sendo censurados (as linhas verticais). À medida que a população em risco diminui, as estimativas de sobrevivência se tornam menos certas. Se você tivesse plotado intervalos de confiança de 95% nas linhas de KM, veria a largura do intervalo de confiança aumentar. Isso é importante para a estimativa de riscos também. Simplificando, como a população em risco e a quantidade de eventos no período final do seu estudo é baixa, esse período contribuirá menos para as estimativas do seu modelo inicial de cox.

Por fim, isso explicaria por que o risco (constante assumida ao longo do tempo) está mais alinhado com a primeira parte do seu KM, em vez do ponto final final.

EDIT: veja o comentário pontual de @ Scrotchi à pergunta original: Como afirmado, o efeito de números baixos no período final do estudo é que as estimativas dos perigos nesses momentos são incertas. Consequentemente, você também tem menos certeza de que a aparente violação da suposição de riscos proporcionais não se deve ao acaso. Como afirma o @ scrotchi, a suposição de PH pode não ser tão ruim assim.

IWS
fonte

(-1) As caudas se cruzam nos extremos, onde temos muito poucos dados. De fato, a evidência para "riscos não proporcionais" é baseada em apenas duas observações (ou seja, quando t> 2800, restavam apenas dois indivíduos na coorte feminina e, além disso, o último evento anterior ao grupo era próximo de t = 2100)

Cliff AB

@CliffAB Obrigado pelo feedback Cliff AB. Estou um pouco confuso, pois sua observação é exatamente o que eu estava tentando dizer. Admito: poderia ter sido um pouco mais curto. O -1 é um pouco duro, porém: '(

IWS 15/06

talvez tenha sido um pouco cruel comigo. Meu único argumento é que, quando olho para isso, não vejo necessariamente um bom exemplo de riscos não proporcionais, mas sim poucos dados sobre as caudas. Vejo que a primeira frase foi revisada (acho que, a menos que eu tenha esquecido isso da primeira vez?), Mas agora o (-1) é definitivamente desnecessário.

Cliff AB

Opa, parece que eu senti falta da primeira vez. Desculpa!

Cliff AB

Não há problema, pelo menos concordamos com a resposta: D

IWS

Você está confuso quanto à natureza da sua saída. Esses dados dizem: Se você é homem, é mais provável que viva mais que uma mulher; As fêmeas têm pior sobrevivência do que os machos. Isso se reflete na saída da regressão, pois o efeito de ser HOMEM é ter uma taxa de risco de log negativa, por exemplo, os homens têm menor risco que as mulheres. Na maioria dos momentos do evento (quando as curvas "pisam"), a curva de sobrevivência masculina é maior que a das mulheres, os resultados e o gráfico do modelo de Cox concordam muito bem. As curvas KM confirmam isso, assim como a saída do modelo de regressão. A "cruz" é inconseqüente.

As curvas de KM se comportam mal nas caudas, especialmente quando se aproximam de 0% e / ou diminuem de forma plana. O eixo Y é a proporção que sobrevive. Com relativamente poucos que sobrevivem por muito tempo no estudo e poucos que morrem na época, a confiabilidade das estimativas é intuitiva e graficamente terrível. Observo, por exemplo, que há muito menos mulheres na sua coorte do que homens e que, após 2.800 dias, restam menos de 10 mulheres na coorte, como evidenciado pelos passos na curva de sobrevida e falta de eventos censurados.

Como uma observação interessante, como as análises de sobrevivência usando curvas de KM, testes de log rank e modelos de Cox usam o tempo de sobrevivência classificado , a duração real da sobrevivência é um tanto irrelevante. Sua fêmea sobrevivente mais longa poderia, de fato, sobreviver por mais 100 anos e não teria impacto nas análises. Isso ocorre porque a função de risco de linha de base (não tendo observado nenhum evento nos últimos 13 anos) presumiria que não havia risco de morte nos próximos 87 anos, pois ninguém morreu naquela época.

Se você deseja que um RH robusto obtenha ICs e valores de p de 95% corretos para isso, especifique robust=TRUEno Cox-PH para obter erros padrão sanduíche. Nesse caso, a FC é uma FC com média de tempo comparando homens e mulheres em todos os momentos de falha.

AdamO
fonte

Para esclarecer: No gráfico de KM, os machos têm melhor sobrevida até cerca de 2700 dias. Depois disso, as mulheres têm melhor sobrevivência. Mas essa cauda não é precisa, porque há tão poucos dados por aí. Você pode ver que duas etapas na curva de KM levam a sobrevivência feminina de cerca de 35% a 0%, o que é provavelmente duas pessoas. Seria útil traçar as curvas de KM com faixas de confiança. Então, acho que você verá uma separação clara até cerca de 2000 dias e depois se sobreporá.

precisa saber é o seguinte

@HarveyMotulsky verdade, mas as caudas dos KMs não são muito confiáveis. Se o OP desenhasse os ICs, eles se sobreporiam fortemente, de modo que, inferencialmente, diríamos que a sobrevivência provavelmente foi equívoca após 2.700 dias.

Adamo

Exatamente o meu ponto. Os dados mostram claramente que os homens (nessa situação, seja o que for) têm melhor sobrevida pelo menos nos primeiros 2.000 dias.

precisa saber é o seguinte