A variável X (perigo) na análise de regressão proporcional ao risco de Cox sempre precisa ser tempo? Caso contrário, você poderia fornecer um exemplo, por favor?
A idade do paciente com câncer pode ser uma variável de risco? Em caso afirmativo, pode ser interpretado como o risco de contrair câncer em uma certa idade? A regressão de Cox seria uma análise legítima para estudar a associação entre expressão gênica e idade?
Geralmente, a idade na linha de base é usada como covariável (porque geralmente está associada a doença / morte), mas também pode ser usada como escala de tempo (acho que é usada em alguns estudos longitudinais, porque você precisa ter o suficiente). pessoas em risco ao longo da escala de tempo, mas não me lembro de verdade - acabei de encontrar esses slides sobre Analisar estudos de coorte, assumindo uma escala de tempo contínua que fala sobre estudos de coorte). Na interpretação, você deve substituir o tempo do evento por idade e incluir a idade no diagnóstico como covariável. Isso faria sentido quando você estuda a mortalidade específica por idade de uma doença específica (conforme ilustrado nestes slides ).
@chi: Muito obrigado. Vou procurar os papéis. Você poderia comentar a primeira pergunta? O risco é sempre variável?
yuk
@yuk Não necessariamente, como sugerido por @whuber. Tenho em mente outra aplicação da regressão de Cox que trata do tratamento do padrão sistemático de respostas perdidas nos testes educacionais, pois surge quando um aluno não tem tempo suficiente para concluir o teste (as respostas ausentes podem ser consideradas como censuradas à direita) - - nesse caso, trata-se da ordem dos itens que é considerada como a escala de tempo. Vou dar uma olhada no artigo original (apesar de achar que esse também foi o assunto de um doutorado).
chl
+1. Existem outros trabalhos, mas não tenho certeza se são necessariamente melhores; Acho que Chalise faz um bom trabalho resumindo a situação.
ars
7
Não, nem sempre é preciso ter tempo. Muitas respostas censuradas podem ser modeladas com técnicas de análise de sobrevivência. Em seu livro Não Detectados e Análise de Dados , Dennis Helsel defende o uso negativo de uma concentração no tempo (para lidar com não detectados, que quando negados tornam-se valores censurados à direita). Uma sinopse está disponível na Web (formato pdf) e um pacote R, NADA , implementa isso.
+1, obrigado por apontar o pacote NADA. Notei que facilita o tratamento de dados censurados à esquerda por meio do pacote de sobrevivência - é censurado à esquerda um cenário comum com dados ambientais?
quer
@ whuber: Obrigado pelo comentário, o pacote NADA parece muito interessante.
yuk
@ Andy: Obrigado pelos links. Eu acho que vale a pena ser uma resposta. Eu votaria.
yuk
@ Yuk, por sua solicitação, fiz meu comentário em uma resposta e @ whuber, obrigado pelo seu exemplo.
Andy W
@ars: Sim, a censura à esquerda é característica dos dados ambientais (e é uma das principais preocupações da quimiometria em geral). É um problema complicado e interessante. Entre as razões estão: (1) os limites de censura são determinados por estimativas estatísticas (por meio de um processo de calibração); (2) a censura pode ocorrer de várias maneiras - como limites de detecção, limites de quantificação ou "limites de relatório" ( 3) os limiares geralmente variam em resposta a covariáveis ("interferências matriciais") que podem ser fortemente correlacionadas com os valores censurados originais, (4) os dados geralmente são distribuídos normalmente de forma logarítmica.
whuber
4
Na questão da escala de idade versus escala de tempo, chl tem boas referências e capta o essencial - em particular, o requisito de que o conjunto de risco contenha sujeitos suficientes de todas as idades, como surgiria em um estudo longitudinal.
Gostaria apenas de observar que ainda não há consenso geral sobre isso, mas há literatura que sugere que a idade deve ser preferida como escala de tempo em certos casos. Em particular, se você tiver uma situação em que o tempo não se acumula da mesma maneira para todos os assuntos, por exemplo, devido à exposição a algum material tóxico, a idade pode ser mais apropriada.
Por outro lado, você pode lidar com esse exemplo específico em um modelo Cox PH em escala de tempo usando a idade como uma covariável variável no tempo - em vez de uma covariável fixa na hora de início. Você precisa pensar no mecanismo por trás do seu objeto de estudo para descobrir qual escala de tempo é mais apropriada. Às vezes, vale a pena ajustar os dois modelos aos dados existentes para verificar se existem discrepâncias e como elas podem ser explicadas antes de projetar seu novo estudo.
Finalmente, a diferença óbvia na análise dos dois é que, em uma escala de idade, a interpretação da sobrevivência é em relação a uma escala absoluta (idade), enquanto que em uma escala de tempo, é relativa à data de início / entrada do estudo. .
De acordo com a solicitação do OP, aqui está outra aplicação que eu vi que a análise de sobrevivência usada em um contexto espacial (embora obviamente diferente da medição das substâncias ambientais mencionadas pelo whuber) está modelando a distância entre os eventos no espaço. Aqui está um exemplo em criminologia e aqui está um em epidemiologia .
O raciocínio por trás do uso da análise de sobrevivência para medir a distância entre eventos não é, por exemplo, uma questão de censura (embora a censura possa ocorrer definitivamente em um contexto espacial), é mais ainda por causa das distribuições semelhantes entre o tempo para as características do evento e a distância entre os eventos. características (ou seja, ambas têm tipos semelhantes de estruturas de erro (freqüentemente decaimento à distância) que violam o OLS e, portanto, as soluções não paramétricas são ideais para ambas).
Por causa das minhas práticas inadequadas de citação, tive que gastar e encontrar o link / referência correto para o link acima.
Para o exemplo em criminologia,
Kikuchi, George, Mamoru Amemiya, Tomonori Saito, Takahito Shimada e Yutaka Harada. 2010. Uma análise espaço-temporal da vitimização quase repetida no Japão . 8ª Conferência Nacional de Mapeamento do Crime. Instituto Jill Dando de Ciência do Crime. PDF atualmente disponível na página referenciada.
Não, nem sempre é preciso ter tempo. Muitas respostas censuradas podem ser modeladas com técnicas de análise de sobrevivência. Em seu livro Não Detectados e Análise de Dados , Dennis Helsel defende o uso negativo de uma concentração no tempo (para lidar com não detectados, que quando negados tornam-se valores censurados à direita). Uma sinopse está disponível na Web (formato pdf) e um pacote R, NADA , implementa isso.
fonte
Na questão da escala de idade versus escala de tempo, chl tem boas referências e capta o essencial - em particular, o requisito de que o conjunto de risco contenha sujeitos suficientes de todas as idades, como surgiria em um estudo longitudinal.
Gostaria apenas de observar que ainda não há consenso geral sobre isso, mas há literatura que sugere que a idade deve ser preferida como escala de tempo em certos casos. Em particular, se você tiver uma situação em que o tempo não se acumula da mesma maneira para todos os assuntos, por exemplo, devido à exposição a algum material tóxico, a idade pode ser mais apropriada.
Por outro lado, você pode lidar com esse exemplo específico em um modelo Cox PH em escala de tempo usando a idade como uma covariável variável no tempo - em vez de uma covariável fixa na hora de início. Você precisa pensar no mecanismo por trás do seu objeto de estudo para descobrir qual escala de tempo é mais apropriada. Às vezes, vale a pena ajustar os dois modelos aos dados existentes para verificar se existem discrepâncias e como elas podem ser explicadas antes de projetar seu novo estudo.
Finalmente, a diferença óbvia na análise dos dois é que, em uma escala de idade, a interpretação da sobrevivência é em relação a uma escala absoluta (idade), enquanto que em uma escala de tempo, é relativa à data de início / entrada do estudo. .
fonte
De acordo com a solicitação do OP, aqui está outra aplicação que eu vi que a análise de sobrevivência usada em um contexto espacial (embora obviamente diferente da medição das substâncias ambientais mencionadas pelo whuber) está modelando a distância entre os eventos no espaço. Aqui está um exemplo em criminologia e aqui está um em epidemiologia .
O raciocínio por trás do uso da análise de sobrevivência para medir a distância entre eventos não é, por exemplo, uma questão de censura (embora a censura possa ocorrer definitivamente em um contexto espacial), é mais ainda por causa das distribuições semelhantes entre o tempo para as características do evento e a distância entre os eventos. características (ou seja, ambas têm tipos semelhantes de estruturas de erro (freqüentemente decaimento à distância) que violam o OLS e, portanto, as soluções não paramétricas são ideais para ambas).
Por causa das minhas práticas inadequadas de citação, tive que gastar e encontrar o link / referência correto para o link acima.
Para o exemplo em criminologia,
Kikuchi, George, Mamoru Amemiya, Tomonori Saito, Takahito Shimada e Yutaka Harada. 2010. Uma análise espaço-temporal da vitimização quase repetida no Japão . 8ª Conferência Nacional de Mapeamento do Crime. Instituto Jill Dando de Ciência do Crime. PDF atualmente disponível na página referenciada.
Em epidemiologia,
Leitor, Steven. 2000. Usando a análise de sobrevivência para estudar padrões de pontos espaciais em epidemiologia geográfica. Ciências Sociais e Medicina 50 (7-8): 985-1000.
fonte