Como interpretar os principais efeitos (coeficientes do fator codificado por dummy) em uma regressão de Poisson?
Suponha o seguinte exemplo:
treatment <- factor(rep(c(1, 2), c(43, 41)),
levels = c(1, 2),
labels = c("placebo", "treated"))
improved <- factor(rep(c(1, 2, 3, 1, 2, 3), c(29, 7, 7, 13, 7, 21)),
levels = c(1, 2, 3),
labels = c("none", "some", "marked"))
numberofdrugs <- rpois(84, 10) + 1
healthvalue <- rpois(84, 5)
y <- data.frame(healthvalue, numberofdrugs, treatment, improved)
test <- glm(healthvalue~numberofdrugs+treatment+improved, y, family=poisson)
summary(test)
A saída é:
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 1.88955 0.19243 9.819 <2e-16 ***
numberofdrugs -0.02303 0.01624 -1.418 0.156
treatmenttreated -0.01271 0.10861 -0.117 0.907 MAIN EFFECT
improvedsome -0.13541 0.14674 -0.923 0.356 MAIN EFFECT
improvedmarke -0.10839 0.12212 -0.888 0.375 MAIN EFFECT
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Eu sei que a taxa de incidentes numberofdrugs
é de exp(-0.023)=0.977
. Mas como interpreto os principais efeitos das variáveis dummy?
r
generalized-linear-model
interpretation
poisson-distribution
regression-coefficients
- Reinstate Monica
fonte
fonte
Respostas:
O
numberofdrugs
coeficiente exponencial é o termo multiplicativo a ser usado para calcular a estimativahealthvalue
quandonumberofdrugs
aumenta em 1 unidade. No caso de variáveis categóricas (fator), o coeficiente exponenciado é o termo multiplicativo relativo ao nível base (primeiro fator) dessa variável (já que R usa os contrastes de tratamento por padrão). Essaexp(Intercept)
é a taxa de linha de base e todas as outras estimativas seriam relativas a ela.No seu exemplo, o estimado
healthvalue
para alguém com2
drogas"placebo"
eimprovement=="none"
seria (usando adição dentro de exp como o equivalente à multiplicação):Enquanto alguém que usa
4
drogas ,,"treated"
e"some"
melhoria teria uma estimativahealthvalue
deADENDO: Isto é o que significa ser "aditivo na escala logarítmica". "Aditivo na escala log-odds" foi a frase que minha professora, Barbara McKnight, usou ao enfatizar a necessidade de usar todos os coeficientes de termos aplicados na regressão logística ao fazer qualquer tipo de previsão. Você adiciona primeiro todos os coeficientes vezes os valores de covariáveis e, em seguida, exponencia. A maneira de retornar coeficientes de objetos de regressão em R é geralmente usar a
coef()
função extrator (feita com uma realização aleatória diferente abaixo):Portanto, o cálculo da estimativa para um sujeito com
4
drogas"treated"
, com"some"
melhoria seria:E o preditor linear para esse caso deve ser a soma de:
Esses princípios devem se aplicar a qualquer pacote de estatísticas que retorne uma tabela de coeficientes para o usuário. O método e os princípios são mais gerais do que podem parecer no meu uso de R.
Estou copiando os comentários esclarecedores selecionados, pois eles 'desaparecem' na exibição padrão:
A: Os coeficientes são os logaritmos naturais das proporções. - DWin
A2: Não. Se fosse regressão logística, eles seriam apenas na regressão de Poisson, onde o LHS é o número de eventos e o denominador implícito é o número em risco, então os coeficientes exponenciados são "taxas de taxa" ou "riscos relativos".
fonte