Qual é o valor "

18

Qual é o valor de dado no resumo de um modelo de coxph em R? Por exemplo,R2

Rsquare= 0.186   (max possible= 0.991 )

Eu tolamente incluí um manuscrito como valor e o revisor saltou dizendo que não estava ciente de um análogo da estatística a partir da regressão linear clássica que está sendo desenvolvida para o modelo de Cox e, se houver, por favor fornecer uma referência. Qualquer ajuda seria ótimo!R2R2

danielsbrewer
fonte
1
Na maioria das situações em que o conceito de seja alargada para além de regressão linear clássico, é a correlação quadrados entre os valores observados e os valores previstos segundo o modelo. Isso poderia ser aplicável aqui? R2
Macro
2
Não, não está relacionado a isso.
Frank Harrell

Respostas:

15

Usando getS3method("summary","coxph")você pode ver como é calculado.

As linhas de código relevantes são as seguintes:

logtest <- -2 * (cox$loglik[1] - cox$loglik[2])
rval$rsq <- c(rsq = 1 - exp(-logtest/cox$n), maxrsq = 1 - 
        exp(2 * cox$loglik[1]/cox$n))

Aqui cox$loglikestá "um vetor de comprimento 2 que contém a probabilidade logarítmica com os valores iniciais e com os valores finais dos coeficientes" (ver ?coxph.object) e cox$né "número de observações usadas no ajuste".

Roland
fonte
5
Se não me engano, esse é o pseudo-quadrado de Cox & Snell. Para explicação e comparação de vários pseudo-quadrados R, consulte ats.ucla.edu/stat/mult_pkg/faq/general/psuedo_rsquareds.htm .
onestop
4

Dividindo por o número de observações no resumo de está errado, deve ser o número de eventos sem censura; ver O'Quigley et al. (2005) Aleatoriedade explicada em modelos de riscos proporcionais Statistics in Medicine p. 479-489.ncoxph

Ronghui Xu
fonte
4
Incorreto, você divide pelo número de observações, por mais estranho que isso pareça. Para a pergunta original, é estranho que um revisor não esteja ciente de algo que existe há 20 anos para o modelo de Cox.
Frank Harrell
Além da troca entre Ronghui Xu e @Frank Harrell, não apenas `` soa estranho '' dividindo pelo número de observações, mas também não funciona. Para ver isso, considere beta fixo em algum valor para que, aproximadamente, E (R2) = 0,5, e a mesma distribuição covariável, ou seja, tudo a mesma coisa, exceto pelo fato de o Estudo 1 ter o dobro da taxa de censura do Estudo 2 Embora devamos estimar a mesma quantidade populacional, as estimativas de R2 no Estudo 1 serão aproximadamente metade das do Estudo 2, independentemente do tamanho da amostra. Em vez de 0,5, estaríamos chegando a 0,25.
R2
Em resposta à observação de Frank, eu concordaria que isso não é direto e que a observação de Frank sobre a probabilidade nula de log está correta. Eu só vi essa quantidade como uma aproximação a um estimador consistente de uma quantidade populacional bem definida com base no ganho de informação. O artigo referido por Ronghui Xu realiza simulações. Eles mostram que o impacto da censura, embora não ausente, é muito mais fraco quando dividimos pelo número de falhas e não pelo número total de observações.
1
R2