Modelo de risco proporcional de Cox e interpretação dos coeficientes quando há interação de maiúsculas e minúsculas

9

Aqui está o resumo do resultado do modelo de Coxph que eu usei (usei R e o resultado é baseado no melhor modelo final, ou seja, todas as variáveis ​​explicativas significativas e suas interações estão incluídas):

 coxph(formula = Y ~ LT + Food + Temp2 + LT:Food + LT:Temp2 + 
Food:Temp2 + LT:Food:Temp2) # Y<-Surv(Time,Status==1)

n = 555

               coef         exp(coef)          se(coef)      z           Pr(>|z|)     
LT             9.302e+02      Inf             2.822e+02    3.297        0.000979 *** 
Food           3.397e+03      Inf             1.023e+03    3.321        0.000896 *** 
Temp2          5.016e+03      Inf             1.522e+03    3.296        0.000979 *** 
LT:Food        -2.250e+02    1.950e-98        6.807e+01    -3.305       0.000949 *** 
LT:Temp2       -3.327e+02    3.352e-145       1.013e+02    -3.284       0.001022 ** 
Food:Temp2     -1.212e+03    0.000e+00        3.666e+02    -3.307       0.000942 *** 
LT:Food:Temp2   8.046e+01    8.815e+34        2.442e+01     3.295       0.000986 *** 
--- 
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 

Rsquare= 0.123   (max possible= 0.858 ) 
Likelihood ratio test= 72.91  on 7 df,   p=3.811e-13 
Wald test            = 55.79  on 7 df,   p=1.042e-09 
Score (logrank) test = 78.57  on 7 df,   p=2.687e-14 

Questão é:

Como interpretar valores de coeficiente e exp (coef) nesse caso, pois são valores muito grandes? Também há interação de três casos, o que confunde mais a interpretação.

Todos os exemplos relativos ao modelo de Coxph que encontrei até agora on-line foram realmente simples em relação aos termos de troca (que sempre se mostraram insignificantes) e também aos valores dos coeficientes (= taxas de risco) e exponenciais destes (= índices de risco) foram muito pequenos e números "fáceis de manusear", por exemplo, coeficiente = 1,73 -> exp (coef) = 5,64. MAS os meus são números muito maiores, como você pode ver na saída do resumo (acima). E por serem tão grandes, quase parecem não fazer sentido.

Parece um pouco ridículo pensar que a sobrevivência é, por exemplo, 8.815e + 34 (taxa de risco extraída da interação LT: Comida: Temp2) vezes mais baixa quando a interação aumenta em uma unidade (?).

Na verdade, também não sei como interpretar essa interação de três casos. Isso significa que, quando todas as variáveis ​​na interação aumentam em uma unidade, a sobrevivência diminui na quantidade certa (contada pelo valor exp (coef))?

Seria ótimo se alguém pudesse me ajudar aqui. :)

Abaixo está a parte da minha folha de dados que usei para a análise cox. Aqui você pode ver que eu usei muitas vezes o mesmo valor explicativo da variável (isto é, LT, Comida e Temp2) para várias "Variáveis ​​de resposta de tempo e status". Esses valores das variáveis ​​explicativas já são os valores médios dessas variáveis ​​(devido à configuração do trabalho de campo na natureza, não foi possível obter o valor da variável explicativa individual para cada resposta observada, portanto, os valores médios já utilizados nesta fase ), e isso responderia à sugestão 1 (?) (consulte a primeira resposta).

Sugestão 2 (veja a 1ª resposta): Estou usando R e ainda não sou super deus nele. :) Portanto, se eu usar a função prever (cox.model, tipo = "esperado"), recebo uma quantidade enorme de valores diferentes e não tenho idéia de qual variável explicativa eles estão se referindo e em que ordem. Ou é possível destacar certo termo de interação na função de previsão? Não tenho certeza se estou me deixando muito claro aqui.

Sugestão 3 (ver 1ª resposta): na parte da folha de dados abaixo, podem-se ver as unidades de diferentes variáveis ​​explicativas. Eles são todos diferentes e incluem decimais. Isso pode ter algo a ver com o resultado cox?

Parte da folha de dados:

Time (days)     Status      LT(h) Food (portions per day) Temp2 C)
28                0         14.42        4.46             3.049
22                0         14.42        4.46             3.049
9                 1         14.42        4.46             3.049
24                0         15.33        4.45             2.595
24                0         15.33        4.45             2.595
19                1         15.33        4.45             2.595

Saúde, Unna

Unna
fonte
@MansT: Nice ter editado a questão ;-)
Ocram

Respostas:

7

Algumas sugestões, não diretamente relacionadas ao CoxPH, mas a interações e colinearidades

1) Quando você está obtendo valores "loucos" como esses, uma possibilidade é a colinearidade. Isso geralmente é um problema quando você tem interações. Você centralizou todas as suas variáveis ​​(subtraindo a média de cada uma)?

2) Você não pode interpretar uma interação entre muitas com tanta facilidade. LT, comida e temp2 estão todos envolvidos em muitas interações. Portanto, observe os valores previstos de diferentes combinações.

3) Verifique as unidades das diferentes variáveis. Quando você obtém parâmetros malucos, às vezes é um problema de unidades (por exemplo, medir a altura humana em milímetros ou quilômetros)

4) Depois de esclarecer as coisas, acho que a maneira mais fácil de pensar nos efeitos de diferentes interações (especialmente as de nível superior) é representar graficamente os valores previstos com diferentes combinações dos valores independentes.

Peter Flom - Restabelece Monica
fonte
Olá, abaixo está a parte da minha folha de dados que usei para a análise cox. Aqui você pode ver que eu usei muitas vezes o mesmo valor explicativo da variável (por exemplo, LT, Comida e Temp2) por várias variáveis ​​de resposta Tempo e Status. Esses valores das variáveis ​​explicativas já são os valores médios dessas variáveis ​​(devido à configuração do trabalho de campo na natureza, não foi possível obter o valor da variável explicativa individual para cada resposta observada, portanto, os valores médios já utilizados nesta fase ), e isso responderia à sugestão 1 (?).
Unna
Sugestão 2: Estou usando R e ainda não sou super deus nele. :) Portanto, se eu usar a função prever (cox.model, tipo = "esperado"), recebo uma quantidade enorme de valores diferentes e não tenho idéia de qual variável explicativa eles estão se referindo e em que ordem. Ou é possível destacar certo termo de interação na função de previsão? Não tenho certeza se estou me deixando muito claro aqui.
Unna
Sugestão 3: na parte da folha de dados abaixo, podem-se ver as unidades de diferentes variáveis ​​explicativas. Eles são todos diferentes e incluem decimais. Isso pode ter algo a ver com o resultado cox?
Unna
Tempo (dias) Status LT (h) Comida (porções por dia) Temp2 (ºC) 28 0 14,42 4,46 3,049 22 0 14,42 4,46 3,049 9 1 14,42 4,46 3,049 24 0 15,33 4,45 2,595 24 0 15,33 4,45 2,595 19 1 15,33 4,45 2,595
Unna
O comentário acima sobre o exemplo da planilha de dados que usei não aparece na forma de tabela, mas espero que seja possível fazer sentido. :)
Unna