Comparação de CPH, modelo de tempo de falha acelerado ou redes neurais para análise de sobrevivência

10

Eu sou novo na análise de sobrevivência e aprendi recentemente que existem diferentes maneiras de fazer isso, com um determinado objetivo. Estou interessado na implementação real e na adequação desses métodos.

Fui apresentado aos tradicionais Riscos Proporcionais de Cox , modelos de tempos de falha acelerados e redes neurais (perceptron multicamada) como métodos para obter a sobrevivência de um paciente, devido ao seu tempo, status e outros dados médicos. Diz-se que o estudo é determinado em cinco anos e o objetivo é dar riscos de sobrevivência a cada ano para que novos registros sejam dados.

Encontrei dois casos em que outros métodos foram escolhidos sobre o PH de Cox:

  1. Encontrei " Como obter previsões em termos de tempo de sobrevivência a partir de um modelo Cox PH " e foi mencionado que:

    Se você estiver particularmente interessado em obter estimativas da probabilidade de sobrevivência em determinados momentos, eu indicaria modelos de sobrevivência paramétricos (também conhecidos como modelos de tempo de falha acelerada) . Eles são implementados no pacote de sobrevivência para R e fornecerão distribuições paramétricas de tempo de sobrevivência, nas quais você pode simplesmente conectar o tempo em que está interessado e recuperar uma probabilidade de sobrevivência.

    Eu fui ao site recomendado e encontrei um no survivalpacote - a função survreg.

  2. As redes neurais foram sugeridas neste comentário :

    ... Uma vantagem das abordagens da rede neural para a análise de sobrevivência é que elas não se baseiam nas suposições subjacentes à análise de Cox ...

    Outra pessoa com a pergunta " Modelo de rede neural com vetor alvo como saída contendo previsões de sobrevivência " deu uma maneira exaustiva de determinar a sobrevivência nas redes neurais e no Cox PH.

    O código R para obter a sobrevivência seria assim:

    mymodel <- neuralnet(T1+T2+T3+T4+T5~covar1+covar2+covar3+..., data=mydata, hidden=1)
    compute(mymodel,data=mydata)
    
  3. Eu fui aos fóruns do R e encontrei esta resposta na pergunta " predict.coxph e predict.survreg " :

    De fato, a partir da predict()função do, coxphvocê não pode obter previsões diretamente de "tempo", mas apenas pontuações de risco lineares e exponenciais. Isso ocorre porque, para obter o tempo, um risco de linha de base deve ser calculado e não é simples, pois está implícito no modelo de Cox.

Eu queria saber se qual dos três (ou dois, considerando os argumentos sobre Cox PH) é melhor para obter porcentagens de sobrevivência por períodos de interesse? Estou confuso qual deles usar na análise de sobrevivência.

Litiu final
fonte

Respostas:

9

Depende de por que você está fazendo modelos. Duas razões principais para construir modelos de sobrevivência são (1) fazer previsões ou (2) modelar tamanhos de efeito de covariáveis.

Se você deseja usá-los em um cenário preditivo no qual deseja obter um tempo de sobrevivência esperado, dado um conjunto de covariáveis, as redes neurais provavelmente são a melhor escolha, porque são aproximadores universais e fazem menos suposições do que o (semi) paramétrico usual modelos. Outra opção menos popular, mas não menos poderosa, são as máquinas de vetores de suporte .

Se você estiver modelando para quantificar os tamanhos dos efeitos, as redes neurais não serão muito úteis. Os riscos proporcionais de Cox e os modelos de tempo de falha acelerado podem ser usados ​​para esse objetivo. Os modelos de Cox PH são de longe os mais amplamente utilizados em contextos clínicos, nos quais a taxa de risco fornece uma medida do tamanho do efeito para cada covariável / interação. Em configurações de engenharia, no entanto, os modelos AFT são a arma de escolha.

Marc Claesen
fonte
11
obrigado pela resposta! Você disse exatamente - " para obter um tempo de sobrevivência esperado, dado um conjunto de covariáveis ". Vou ter que ir com as redes neurais e SVMs no meu estudo.
Final Litiu
Marc Claesen: O modelo Cox PH fornece P (tempo de sobrevivência> t). Não é possível obter o pdf do tempo de sobrevivência a partir daí e obter uma amostra do pdf?
statBeginner
@ Marc Claesen Presumo que as redes neurais não possam ser diretamente aplicadas ao problema de análise de sobrevivência, mas o problema de análise de sobrevivência deve ser primeiro convertido em um problema de classificação ou regressão. Então, você pode explicar como o problema da análise de sobrevivência pode ser convertido em um problema de classificação ou regressão para que redes neurais possam ser aplicadas? Por favor, responda aqui se possível stats.stackexchange.com/questions/199549/…
GeorgeOfTheRF