Análise de sobrevivência: tempo contínuo versus tempo discreto

20

Estou confuso sobre como decidir se trata o tempo como contínuo ou discreto na análise de sobrevivência. Especificamente, quero usar a análise de sobrevivência para identificar variáveis ​​no nível infantil e doméstico que tenham a maior discrepância em seu impacto na sobrevida de meninos versus meninas (até 5 anos). Eu tenho um conjunto de dados de idades da criança (em meses) junto com um indicador para saber se a criança está viva, a idade da morte (em meses) e outras variáveis ​​em nível de criança e família.

Como o tempo é registrado em meses e todas as crianças têm menos de 5 anos, há muitos tempos de sobrevivência vinculados (geralmente em intervalos de meio ano: 0mos, 6mos, 12mos, etc.). Com base no que li sobre a análise de sobrevivência, ter muitos tempos de sobrevivência vinculados me faz pensar que devo tratar o tempo como discreto. No entanto, li vários outros estudos em que o tempo de sobrevivência é, por exemplo, anos-pessoa (e com certeza há tempos de sobrevivência vinculados) e métodos de tempo contínuo, como os riscos proporcionais de Cox, são usados.

Quais são os critérios que devo usar para decidir se devo tratar o tempo como contínuo ou discreto? Para meus dados e perguntas, usar algum modelo de tempo contínuo (Cox, Weibull etc.) faz sentido para mim, mas a natureza discreta dos meus dados e a quantidade de tempos de sobrevivência vinculados parecem sugerir o contrário.

smm
fonte

Respostas:

10

A escolha do modelo de sobrevivência deve ser guiada pelo fenômeno subjacente. Nesse caso, parece ser contínuo, mesmo que os dados sejam coletados de maneira um tanto discreta. Uma resolução de um mês seria ótima durante um período de 5 anos. No entanto, o grande número de laços aos 6 e 12 meses faz com que você se pergunte se você realmente tem uma precisão de 1 mês (os laços em 0 são esperados - esse é um valor especial em que, na verdade, ocorrem muitas mortes). Não tenho muita certeza do que você pode fazer sobre isso, pois isso provavelmente reflete o arredondamento após o fato, em vez de a censura por intervalo.

Aniko
fonte
2
Como regra geral, se os dados discretos podem ser divididos em dez ou mais partes, eles podem ser tratados como contínuos, mesmo que sejam realmente discretos (amostragem uma vez por mês por seis meses é muito diferente de amostragem semanal por seis meses) ou uma vez por mês durante dois anos). O seguinte artigo também dá alguns insights adicionais para tratar dados discretos como contínuo: theanalysisfactor.com/count-data-considered-continuous
Tavrock
4

Eu suspeito que, se você usa modelos de tempo contínuo, você desejará usar a censura por intervalo, refletindo o fato de que você não sabe o tempo exato da falha, apenas um intervalo em que a falha ocorreu. Se você ajustar modelos de regressão paramétricos com censura por intervalo usando a probabilidade máxima, os tempos de sobrevivência vinculados não serão um problema IIRC.

Dikran Marsupial
fonte
4

Haverá tempos de sobrevivência atados na maioria das análises, mas grandes e claros pedaços de vínculo em eventos específicos são preocupantes. Eu pensaria muito sobre o estudo em si, como sua coleta de dados etc.

Porque, fora de algumas necessidades metodológicas de usar um tipo de tempo ou outro, como você modela a sobrevivência deve depender se o processo subjacente é discreto ou contínuo no mundo.

Fomite
fonte
1

Se você possui covariáveis ​​que variam ao longo do tempo para alguns indivíduos (por exemplo, a renda familiar pode variar no seu exemplo ao longo da vida de uma criança), os modelos de sobrevivência (paramétrico e o modelo cox) exigem que você divida os dados em intervalos discretos definidos por as variadas covariáveis.

Achei este pdf de anotações de aula de German Rodriguez útil.

sumtxt
fonte