Análise de sobrevivência em R com dados truncados à esquerda

8

Estou fazendo uma análise de sobrevivência em R com o survivalpacote. Acho que estou trabalhando com dados truncados à esquerda, mas não tenho muita certeza de como lidar com isso.

Eu tenho uma coorte de pacientes diagnosticados entre 1990 e 2012. Todos os pacientes têm um tempo de diagnóstico bem definido (horário de entrada). No entanto, o resultado de interesse (piora específica da doença) só foi documentado a partir do ano 2000 e em diante. Para pacientes diagnosticados antes de 2000, portanto, não se sabe se o resultado ocorreu antes desse período - somente depois.

Meu primeiro pensamento foi que eu precisava restringir a análise ao período de 2000, incluindo apenas os pacientes diagnosticados após esse momento. Depois de fazer algumas leituras, parece desnecessário excluir pacientes diagnosticados antes de 2000. Isso parece truncamento à esquerda e pode ser tratado com o coxphuso Surv(time1, time2, event), em que time1 é o tempo de truncamento esquerdo (tempo desde o diagnóstico até o início da documentação do o resultado) e o tempo 2 é o tempo até o evento (a partir do momento do diagnóstico).

Aqui estão dois exemplos de pacientes no meu conjunto de dados:

Paciente nº 1: Diagnosticado em 1999. Resultado observado em 2001. Tempo de truncamento esquerdo: 1 ano (até 2000). Tempo para o evento: 2 anos.

Paciente # 2: Diagnosticado em 2001. Resultado observado em 2005. Tempo de truncamento esquerdo: 0 anos. Tempo para o evento: 4 anos.

Para esses pacientes, suponho que seus tempos de sobrevivência (em anos) no objeto de sobrevivência sejam (respectivamente):

Surv(time1 = c(1,0), time2 = c(2,4), event = c(1,1))

Este é um exemplo de dados truncados à esquerda? Em caso afirmativo, esta é a maneira correta de lidar com isso?

user3766836
fonte

Respostas:

3

Estou assumindo que o tempo desde o diagnóstico é sua variável de tempo subjacente. Por simplicidade, também presumo que o evento possa ocorrer apenas uma vez.

Você pode tratar seus dados como sendo censurados à esquerda. Isso é diferente de ser truncado à esquerda, no entanto.

Para dados truncados à esquerda, incluímos apenas no estudo pacientes com condição de não terem experimentado o evento no momento da inclusão. No seu caso, isso significaria jogar fora os pacientes que tiveram o evento antes de 2000. Assim, estamos modelando a sobrevivência condicionada à sobrevivência até a inclusão.

Isso é diferente da censura à esquerda. A censura à esquerda ocorre quando sabemos apenas o limite superior da hora de um evento. É exatamente isso que você sugere, se eu entendi corretamente. Nesse caso, incluímos todos os indivíduos, independentemente de seu tempo de sobrevivência, mas para alguns indivíduos sabemos apenas um limite superior de seu tempo de sobrevivência.

Capítulo III de Modelos Estatísticos Baseados em Processos de Contagem por PK Andersen et al. fornece uma boa explicação do exposto acima, além de alguns exemplos de ambos os casos.

swmo
fonte
2

É provável que você tenha um viés de tempo imortal , o que significa que a coorte diagnosticada antes de 2000 é efetivamente imortal, até depois de 2000, quando o resultado pode ocorrer. De acordo com Rothman e Groenlândia, a abordagem correta é realmente excluir (truncar) os anos de observação anteriores a 2000 da análise, ou então desviar o risco entre as estimativas da coorte em direção à hipótese nula de que não há diferença de risco.

O survivalcomando Survnão parece seguir a sintaxe usada. Que tal criar uma nova variável em que o valor 0 corresponde ao Tempo de Início (Estudo) (por exemplo, ano = 2000?), 1 corresponde a 1 unidade de tempo, etc?

Você vai querer ler sobre: ​​Rothman, KJ e Greenland, S. (1998). Epidemiologia Moderna , capítulo Estudos de Coorte - Tempo da Pessoa Imortal. Lippincott-Raven, 2ª edição.

Alexis
fonte
Vejo que o viés de tempo imortal é importante, por exemplo, em ensaios com medicamentos em que os pacientes que recebem o medicamento têm a garantia de viver um determinado tempo pelo desenho do estudo, enquanto o grupo controle não, resultando em um efeito positivo (falso) observado do medicamento. No entanto, no meu caso, a falta de dados de resultados é igual para todos os pacientes, independentemente da exposição. A omissão de todos os pacientes diagnosticados antes de 2000 resultará em uma grave falta de poder estatístico, pois muitos deles terão o resultado após 2000. Acho que deve haver uma maneira de controlar possíveis viés sem omitir esses pacientes.
user3766836
Ah, entendo, isso não estava claro. Por outro lado: talvez seus dados simplesmente não suportem a análise que você deseja executar.
Alexis