Ponderação do escore de propensão na análise de Cox Cox e seleção covariável

11

Em relação à ponderação do escore de propensão (IPTW) ao fazer a modelagem de risco proporcional de Cox dos dados de sobrevivência de tempo para evento:

Tenho dados prospectivos de registro nos quais estamos interessados ​​em analisar o efeito do tratamento de um medicamento que, na maioria dos casos, os pacientes já estavam tomando no início. Portanto, não sei como melhor analisar os dados. Potencialmente, algumas das variáveis ​​de linha de base são em grande parte influenciadas pelo tratamento e não o contrário (por exemplo, certos biomarcadores). Estou um pouco perdido quanto a quais covariáveis ​​devo incluir no modelo de pontuação de propensão para estimar pesos e quais covariáveis ​​devo incluir como covariáveis ​​no coxphmodelo (se houver). Qualquer dica na direção certa seria útil! Ainda não encontrei nenhuma literatura sobre isso na modelagem CoxPh.

Penso que covariáveis ​​que representam tratamentos instituídos na linha de base que (possam) influenciar o resultado devem ser incluídos como covariáveis ​​de Cox PH, mas não tenho certeza disso.

Como determino quais variáveis ​​devem ser incluídas como covariáveis ​​no modelo Cox em vez de serem usadas no cálculo dos pesos do escore de propensão?


Questão a seguir:

Entendo o problema hereditário de avaliar o efeito do tratamento de uma certa intervenção que já começou - ou seja, prevalece entre os pacientes, antes do início da observação. Tanto no que diz respeito à introdução de viés relacionado à variação temporal do risco (por exemplo, efeitos colaterais adversos mais comuns no primeiro ano de terapia) quanto às covariáveis ​​afetadas pelo tratamento. Se não me engano - isso foi proposto como uma causa de discrepância entre observacional e aleatório em relação aos parâmetros cardiovasculares e terapia de reposição hormonal. No meu conjunto de dados, por outro lado, estamos interessados ​​em observar um possível efeito adverso do tratamento.

Se eu usar o ajuste do escore de propensão para investigar o efeito do tratamento entre os usuários prevalentes, ou seja, já usar o medicamento antes do início da observação, nos dados da coorte e observarmos um efeito adverso de uma terapia farmacológica (e é isso que estávamos procurando). Posso descartar a possibilidade de superestimar o risco associado ao tratamento? Ou seja, desde que o risco seja significativamente elevado, é mais "definitivamente" não protetor.

Não consigo imaginar um exemplo em que esse tipo de viés possa introduzir uma superestimação do risco de associação de risco falso nesse contexto.

Kjetil Loland
fonte

Respostas:

9

Em teoria, todas as variáveis ​​que você selecionar como parte do peso do escore de propensão não precisam ser incluídas como covariáveis ​​no modelo, porque a ponderação já controlou seu potencial de confusão. Com um modelo de ponderação adequado, você pode, literalmente, apenas modelar o efeito da exposição.

Dito isto, há razões pelas quais você pode querer incluir termos no modelo:

  • Estimativas "duplamente robustas". Não há razão, exceto pela perda de precisão, de que você não pode usar variáveis ​​no modelo de ponderação e como covariáveis. Em teoria, você está se protegendo contra confusão de duas maneiras (portanto, essa técnica é referida como "duplamente robusta"). Lembre-se de que isso apenas protege você contra o modelo PS ou o modelo covariável que está sendo especificado incorretamente, fornecendo uma "segunda chance" para especificar o modelo correto, não é uma solução mágica.
  • Várias estimativas de interesse. A ponderação faz desaparecer as estimativas de efeito das covariáveis ​​- se você deseja um coeficiente de regressão para a variável, inclua-o como covariável na etapa CoxPH e não no modelo PS.

Tente pesquisar por termos "Duplamente robustos" e similares em periódicos como Epidemiology ou The American Journal of Epidemiology , bem como na literatura bioestatística, e você deve descobrir algumas fontes úteis.

Fomite
fonte
Obrigado por uma resposta (rápida) e clara! Eu já vi duplamente robusto sendo mencionado, mas vi muito a sério. Eu definitivamente vou agora. Você diria que o uso de estimativas duplamente robustas é garantido quando as covariáveis ​​não são ajustadas adequadamente após a ponderação (por exemplo) ainda diferenças significativas entre os grupos de tratamento?
Kjetil Loland
11
@KjetilLoland Essa pode ser uma razão para usar estimativas duplamente robustas - geralmente, é algo para se olhar sempre que você estiver preocupado com o fato de um método para controlar variáveis ​​estar sofrendo de especificação incorreta. Eu também verificaria se o seu modelo de PS não está funcionando e está fornecendo boas e sobrepostas pontuações de propensão entre os dois grupos.
fomite
11
Devido à não recolhibilidade da taxa de risco, não é adequado incluir apenas as variáveis ​​no PS. É comum deixar que o PS inclua a "pia da cozinha" e que os preditores mais importantes sejam incluídos novamente como covariáveis. Isso impedirá a subestimação da taxa de perigos da exposição.
precisa saber é o seguinte
Mais uma vez, obrigado a @EpiGrad e Frank por suas respostas. Não posso dizer exatamente que os grupos de tratamento tenham boas e sobrepostas pontuações de propensão. Então, eu provavelmente acabaria usando um amplo ajuste covariável. Em uma nota lateral, notei que escrevi IPTW, quando na verdade estou usando o pacote twang - que utiliza regressão impulsionada generalizada para estimar pesos (se eu estiver certo) - mas acho que isso não muda a abordagem geral Muito de.
precisa saber é o seguinte
@KjetilLoland Você pode pelo menos inspecionar visualmente se suas pontuações no PS se sobrepõem ou não, observando as parcelas sobrepostas de sua distribuição por grupo de tratamento.
fomite
3

É importante distinguir "afetado pelo tratamento" e "relacionado ao tratamento". O último pode incluir fatores de seleção de tratamento, como os que estamos tentando ajustar com propensão e / ou ajuste covariável. "Afetados pelo tratamento" implica que as covariáveis ​​são medidas após o tempo zero (por exemplo, após a randomização ou após o início do tratamento), o que significa que raramente devem ser usadas.

Frank Harrell
fonte
Mais uma vez obrigado Dr. Harrell. Algumas de nossas variáveis ​​são definitivamente "afetadas pelo tratamento". O tratamento que estamos tentando investigar foi iniciado antes da linha de base, o que obviamente não é ideal. Se o ajuste do escore de propensão é ou não adequado para esse tipo de análise é talvez uma pergunta melhor. No entanto, não conheço outra maneira de investigar isso.
Kjetil Loland
O desenho do estudo pode não ser adequado ao que você deseja fazer. O estudo será muito difícil de interpretar. Você pode solicitar que especialistas no assunto tentem criar um subconjunto de variáveis ​​que provavelmente não mudam com o tratamento, mas o ajuste para confundir por implicação pode estar incompleto.
precisa
Eu vejo. Acho que isso começa a parecer um pouco com os velhos estudos observacionais versus randomizados da TRH sobre DCV. Corrija-me se estiver errado, mas não é tudo o que "arrisco" para subestimar o risco de um possível efeito adverso do tratamento (que é o que estamos procurando) - ou seja, desde que demonstremos que o tratamento é adverso, esse tipo de confusão só poderia enfraquecer a descoberta? Atualizei a pergunta de acordo.
precisa saber é o seguinte
2
Isso é mais do que uma questão observacional versus aleatória, mas existe uma relação com os estudos de TRH. Você pode estar certo de que algum raciocínio cuidadoso pode justificar o tratamento dos resultados como um limite inferior.
precisa