Estou interessado em estimar uma taxa de risco ajustada, análoga a como se estima uma taxa de chances ajustada usando regressão logística. Alguma literatura (por exemplo, isso ) indica que o uso da regressão de Poisson com erros padrão de Huber-White é uma maneira baseada em modelo para fazer isso
Não encontrei literatura sobre como o ajuste para covariáveis contínuas afeta isso. A seguinte simulação simples demonstra que esse problema não é tão claro:
arr <- function(BLR,RR,p,n,nr,ce)
{
B = rep(0,nr)
for(i in 1:nr){
b <- runif(n)<p
x <- rnorm(n)
pr <- exp( log(BLR) + log(RR)*b + ce*x)
y <- runif(n)<pr
model <- glm(y ~ b + x, family=poisson)
B[i] <- coef(model)[2]
}
return( mean( exp(B), na.rm=TRUE ) )
}
set.seed(1234)
arr(.3, 2, .5, 200, 100, 0)
[1] 1.992103
arr(.3, 2, .5, 200, 100, .1)
[1] 1.980366
arr(.3, 2, .5, 200, 100, 1)
[1] 1.566326
Nesse caso, a taxa de risco real é 2, que é recuperada de forma confiável quando o efeito covariável é pequeno. Mas, quando o efeito covariável é grande, isso fica distorcido. Suponho que isso ocorra porque o efeito covariável pode empurrar contra o limite superior (1) e isso contamina a estimativa.
Procurei, mas não encontrei nenhuma literatura sobre o ajuste de covariáveis contínuas na estimativa da razão de risco ajustada. Estou ciente das seguintes postagens neste site:
- Regressão de Poisson para estimar o risco relativo de resultados binários
- Regressão de Poisson para dados binários
mas eles não respondem minha pergunta. Existem documentos sobre isso? Existem precauções conhecidas que devem ser exercidas?
fonte
Respostas:
Não sei se você ainda precisa de uma resposta para essa pergunta, mas tenho um problema semelhante no qual gostaria de usar a regressão de Poisson. Ao executar seu código, descobri que se eu configurasse o modelo como
e não como seu modelo de regressão de Poisson, o mesmo resultado ocorre: o OR estimado é de ~ 1,5 quando ce se aproxima de 1. Portanto, não tenho certeza de que seu exemplo forneça informações sobre um possível problema com o uso da regressão de Poisson para resultados binários.
fonte
binomial(link=log)
para realmente ajustar um modelo de risco relativo, mas ele raramente converge devido a resultados imprevisíveis.Acho que usar a máxima probabilidade direta com a função de probabilidade adequada melhora muito a estimativa do risco relativo. Você pode especificar diretamente a função de risco truncado como a taxa prevista para o processo.
Normalmente, usamos o Hessian para criar ICs para a estimativa. Eu não explorei a possibilidade de usar isso como matriz "B" (carne) no erro Huber White e usar os riscos adequados para obter a matriz "A" (pão) ... mas suspeito que possa funcionar! Mais viável, você pode usar um bootstrap para obter erros de modelo que são robustos a um relacionamento de variação média mal especificado.
Dá:
O coeficiente do meio fornece o que você deseja.
fonte