Como interpreto uma curva de sobrevivência do modelo de risco Cox?

9

Como você interpreta uma curva de sobrevivência a partir do modelo de risco proporcional cox?

Neste exemplo de brinquedo, suponha que tenhamos um modelo de risco proporcional ao cox na agevariável dos kidneydados e gere a curva de sobrevivência.

library(survival)
fit <- coxph(Surv(time, status)~age, data=kidney)
plot(conf.int="none", survfit(fit))
grid()

insira a descrição da imagem aqui

Por exemplo, no tempo , qual afirmação é verdadeira? ou ambos estão errados?200

  • Declaração 1: teremos 20% de indivíduos restantes (por exemplo, se tivermos pessoas, no dia , teremos aproximadamente restantes), 200 2001000200200

  • Declaração 2: Para uma determinada pessoa, ela tem chance de sobreviver no dia .20020%200


Minha tentativa: não acho que as duas afirmações sejam as mesmas (corrija-me se estiver errado), pois não temos a suposição iid (o tempo de sobrevivência para todas as pessoas NÃO é extraído de uma distribuição independentemente). É semelhante à regressão logística na minha pergunta aqui , a taxa de risco de cada pessoa depende de para essa pessoa.βTx

Haitao Du
fonte
Observe que seu modelo assume independência entre os horários dos eventos.
Ocram 27/03
análise de sobrevivência pode ter hipóteses de independência
Aksakal
portanto, parece que a questão é realmente sobre a codificação R, em vez de estatísticas puras. é preciso conhecer a sintaxe e os recursos de funções específicas usadas no exemplo. se for esse o caso, isso não é tópico de alguma maneira? caso contrário, você precisa explicar o que está acontecendo com aqueles que não usam o R
Aksakal

Respostas:

5

Como o risco depende das covariáveis, a função de sobrevivência também. O modelo assume que a função de risco de um indivíduo com vetor covariado é Portanto, o risco cumulativo desse indivíduo é onde podemos definir como o risco cumulativo da linha de base. A função de sobrevivência de um indivíduo com vetor covariado é, por sua vez, onde definimos como a função de sobrevivência da linha de base. x

h(t;x)=h0(t)eβx.
H(t;x)=0th(u;x)du=0th0(u)eβxdu=H0(t)eβx,
H0(t)=0th0(u)dux
S(t;x)=eH(t;x)=eH0eβx=S0(t)eβx
S0(t)=eH0(t)

Dadas as estimativas e dos coeficientes de regressão e a função de sobrevivência de base, uma estimativa da função de sobrevivência para um indivíduo com vetor covariado é dada por . S 0(t)x S (t;x)= S 0(t)e β ' xβ^S^0(t)xS^(t;x)=S^0(t)eβ^x

Ao calcular isso em R, você especifica o valor de suas covariáveis ​​no newdataargumento. Por exemplo, se você deseja a função de sobrevivência para indivíduos com idade = 70, em R, faça

plot(survfit(fit, newdata=data.frame(age=70)))

Se você omitir o newdataargumento, seu valor padrão será igual aos valores médios das covariáveis ​​na amostra (consulte ?survfit.coxph). Portanto, o que é mostrado em seu gráfico é uma estimativa de . S0(t)eβx¯

Jarle Tufto
fonte
Eu concordo com você. Esta é uma resposta bem escrita. Peço desculpas ao OP pelo meu erro e agradeço a maneira como o OP o corrigiu.
Michael R. Chernick
@ hxd1101 Depois de ler a página de ajuda com survfit.coxphmais cuidado, corrigi um erro na minha resposta, consulte a atualização.
Jarle Tufto 26/08
2

Teremos 20% de indivíduos restantes (por exemplo, se tivermos 1000 pessoas, no dia 200, deveríamos ter 200). ou Para uma determinada pessoa, ela tem 20% de chance de sobreviver no dia 200?

Na sua forma mais pura, a curva de Kaplan-Meier no seu exemplo não faz nenhuma das afirmações acima.

A primeira declaração faz uma projeção prospectiva terá . A curva básica de sobrevivência descreve apenas o passado, sua amostra. Sim, 20% da sua amostra sobreviveu até o dia 200. 20% sobreviverão nos próximos 200 dias? Não necessariamente.

Para fazer essa afirmação, você precisa adicionar mais suposições, criar um modelo etc. O modelo nem precisa ser estatístico, como a regressão logística. Por exemplo, poderia PDE em epidemiologia etc.

Sua segunda afirmação provavelmente se baseia em algum tipo de suposição de homogeneidade: todas as pessoas são iguais.

Aksakal
fonte
Não acho que a afirmação 2 esteja correta, pois cada pessoa tem diferente e contribui com o risco. como podemos assumir que todas as pessoas são iguais? β T xxβTx
Haitao Du
@ hxd1011, depende do seu modelo. Se você estivesse modelando peças de carros, poderia muito bem assumir que elas são iguais. por outro lado as suas falhas podem ser correlacionados pelo número de lote, em seguida, eles não são a mesma etc.
Aksakal
Editei minha pergunta para ser mais específico no modelo cox. Sua resposta na curva Kaplan_Meier ainda se aplica?
Haitao Du
2

Obrigado pela resposta de Jarle Tufto. Eu acho que deveria poder responder sozinho: ambas as afirmações são falsas . A curva gerada é mas não .S ( t )S0(t)S(t)

A função de sobrevivência da linha de base será igual a somente quando . Portanto, a curva NÃO está descrevendo toda a população ou qualquer indivíduo.S ( t ) x = 0S0(t)S(t)x=0

Haitao Du
fonte
0

Sua primeira opção está correta. Geralmente, indica que 20% dos pacientes iniciais sobreviveram até o dia , sem levar em consideração a censura . Em dados censurados, não é exatamente correto dizer que 20% ainda estavam vivos naquele dia , pois alguns foram perdidos para acompanhamento mais cedo e seu status é desconhecido. Uma maneira melhor de dizer isso seria a fração estimada de pacientes ainda vivos naquele dia em 20% . tS(t)=0.2t

A segunda opção (chance de sobreviver mais um dia, dada a sobrevivência até ) é , com indicando a função de risco.1 - h ( t ) h ( t )t1h(t)h(t)

Em relação às suposições: eu pensei que os testes de coeficiente usuais em um cenário de regressão de Cox assumem independência, condicionada às covariáveis ​​observadas? Até a estimativa de Kaplan-Meier parece exigir independência entre tempo de sobrevivência e censura ( referência ). Mas posso estar errado, então as correções são bem-vindas.

juod
fonte