Sou iniciante na análise de sobrevivência, embora tenha algum conhecimento em classificação e regressão.
Para regressão, temos estatísticas quadradas de MSE e R. Mas como podemos dizer que o modelo de sobrevivência A é superior ao modelo de sobrevivência B, além de algum tipo de gráfico (curva KM)?
Se possível, explique a diferença com um exemplo (por exemplo, pacote rpart em R). Como você pode mostrar que uma árvore de sobrevivência da CART é melhor que outra árvore de sobrevivência da CART? Quais métricas podem ser usadas?
regression
survival
goodness-of-fit
cart
rpart
inundação
fonte
fonte
Respostas:
(Por fim, é claro, se você tem um objetivo específico em mente para os modelos - ou seja, se você sabe qual é a sua função de perda de previsão - você sempre pode avaliá-los de acordo com a função de perda! Mas eu acho que você ' não tem tanta sorte ...)
Para uma discussão mais aprofundada das estatísticas da razão de verossimilhança e do c de Harrell , você deve examinar o excelente livro didático de Harrell, Regression Modeling Strategies . A seção sobre avaliação de modelos de sobrevivência é §19.10, pp. 492-493. Sinto muito, mas não posso lhe dar uma resposta definitiva, mas não acho que seja um problema resolvido!
fonte
As regressões de riscos proporcionais de Cox para dados de sobrevivência podem ser consideradas como correspondendo às regressões padrão em muitos aspectos. Por exemplo, as regressões de Cox também fornecem erros padrão residuais e estatísticas do quadrado R. Veja a
coxph
função nosurvival
pacote R. (Você pode pensar em curvas de KM como correspondendo a análises não paramétricas nas estatísticas padrão. Como você incorporaria um teste não paramétrico no CART?) Na prática com dados clínicos, os erros padrão residuais tendem a ser altos e os valores do quadrado R baixos na regressão de Cox.Assim, regressões padrão e regressões de Cox têm requisitos e limitações semelhantes. Você deve verificar se os dados se encaixam nas premissas subjacentes, que na análise de Cox incluem ainda a suposição de que os riscos comparados são proporcionais ao longo do tempo. Você ainda precisará evitar o ajuste excessivo e validar seu modelo. E como eu entendo o CART, embora eu não o use, você ainda enfrentará as dificuldades colocadas ao comparar modelos não aninhados.
fonte
rpart
e outros pacotes e códigos R.