Qual é a diferença entre a saída "coef" e "(exp) coef" do coxph em R?

14

Eu tenho tentado discernir o que exatamente a saída "coef" e "(exp) coef" do coxph significa. Parece que o "(exp) coef" são comparações da primeira variável no modelo de acordo com o grupo designado no comando.

Como a função coxph chega aos valores de "coef" e "(exp) coef"?

Além disso, como o coxph determina esses valores quando há censura envolvida?

annemphillip
fonte

Respostas:

21

Se você tiver uma única variável explicativa, digamos grupo de tratamento, um modelo de regressão de Cox é ajustado coxph(); o coeficiente ( coef) é lido como um coeficiente de regressão (no contexto do modelo de Cox, descrito a seguir) e seu exponencial fornece o risco no grupo de tratamento (comparado ao grupo de controle ou placebo). Por exemplo, se β = - 1,80 , em seguida, o perigo é exp ( - 1,80 ) =β^=-1,80 , que é de 16,5%.exp(-1,80)=0,165

Como você deve saber, a função de risco é modelada como

h(t)=h0(t)exp(βx)

onde é o risco da linha de base. Os riscos dependem multiplicativamente das covariáveis ​​e exp ( β 1 ) é a razão dos riscos entre dois indivíduos cujos valores de x 1 diferem em uma unidade quando todas as outras covariáveis ​​são mantidas constantes. A razão entre os riscos de quaisquer dois indivíduos i e j é exp ( β ' ( x i - x j ) )h0(t)exp(β1)x1ijexp(β(xixj)) , e é chamada a razão de risco (ou razão da taxa de incidência) Esta relação é assumido ser constante ao longo do tempo, e daí o. nome derisco proporcional .

Para ecoar sua pergunta anterior sobre survreg, aqui a forma de é deixada não especificada; mais precisamente, esse é um modelo semi-paramétrico, em que apenas os efeitos das covariáveis ​​são parametrizados, e não a função de risco. Em outras palavras, não fazemos nenhuma suposição de distribuição sobre os tempos de sobrevivência.h0(t)

Os parâmetros de regressão são estimados maximizando a probabilidade parcial de log definida por

=flog(exp(βxf)r(f)exp(βxr))

fr(f)βh0(t)h0(t)βh0(t)β ).

Sobre a censura, não está claro se você se refere à censura à esquerda (como pode ser o caso se considerarmos uma origem para a escala de tempo anterior ao momento em que a observação começou, também chamada entrada atrasada ) ou à censura à direita. De qualquer forma, mais detalhes sobre o cálculo dos coeficientes de regressão e como o pacote de sobrevivência lida com a censura podem ser encontrados em Therneau e Grambsch, Modeling Survival Data (Springer, 2000). Terry Therneau é o autor do antigo pacote S. Um tutorial online está disponível.

A Análise de Sobrevivência em R , de David Diez, fornece uma boa introdução à Análise de Sobrevivência em R. Uma breve visão geral deχ2testes para parâmetros de regressão são dados p. 10. Espero que isso ajude a esclarecer a ajuda on-line citada por @onestop , "coeficientes de coeficientes do preditor linear, que multiplicam as colunas da matriz do modelo". Para um livro didático aplicado, eu recomendo Analisando Dados Médicos Utilizando S-PLUS , de Everitt e Rabe-Hesketh (Springer, 2001, cap. 16 e 17), de onde vem a maioria dos itens acima. Outra referência útil é o apêndice de John Fox sobre a regressão de riscos proporcionais de Cox para dados de sobrevivência .

chl
fonte
4
+1, esta é uma resposta realmente informativa a uma pergunta bastante simples e direta. Agradeço especialmente os links para recursos para obter mais informações. NB: o link para o tutorial on-line de Terry Therneau está morto; Um pacote para análise de sobrevivência em S pode ser um link ativo para o mesmo material.
gung - Restabelece Monica
5

Para citar a documentação do método de impressão para um objeto coxph, obtido em R, digitando ?survival::print.coxph:

coefficients os coeficientes do preditor linear, que multiplicam as colunas da matriz do modelo.

Essa é toda a documentação que o autor do pacote fornece. O pacote não contém guia do usuário ou vinheta de pacote. O R não foi projetado para ser fácil de usar e a documentação supõe que você já tenha entendido os métodos estatísticos envolvidos.

Eu diria que a coefcoluna fornece o acima coefficients, e a exp(coef)coluna é o exponencial deles. Como a regressão de Cox envolve uma função de link de log, os coeficientes são as taxas de risco de log . Exponenciá-los, portanto, fornece taxas de risco para as costas.

uma parada
fonte