Call:
glm(formula = darters ~ river + pH + temp, family = poisson, data = darterData)
Deviance Residuals:
Min 1Q Median 3Q Max
-3.7422 -1.0257 0.0027 0.7169 3.5347
Coefficients:
Estimate Std.Error z value Pr(>|z|)
(Intercept) 3.144257 0.218646 14.381 < 2e-16 ***
riverWatauga -0.049016 0.051548 -0.951 0.34166
pH 0.086460 0.029821 2.899 0.00374 **
temp -0.059667 0.009149 -6.522 6.95e-11 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
(Dispersion parameter for poisson family taken to be 1)
Null deviance: 233.68 on 99 degrees of freedom
Residual deviance: 187.74 on 96 degrees of freedom
AIC: 648.21
Eu quero saber como interpretar cada estimativa de parâmetro na tabela acima.
Respostas:
Não acho que o título da sua pergunta capte com precisão o que você está pedindo.
A questão de como interpretar os parâmetros em um GLM é muito ampla, porque o GLM é uma classe muito ampla de modelos. Lembre-se de que um GLM modela uma variável de resposta que se supõe seguir uma distribuição conhecida da família exponencial e que escolhemos uma função invertível g de modo que E [ yy g
paravariáveis preditivas J x . Nesse modelo, a interpretação de qualquer parâmetro específico β j é a taxa de variação de g ( y ) em relação a x j . Definir μ ≡ E [ y
O que significa apenas que é o efeito em η de um aumento de unidade em x j .βj η xj
Você também pode indicar o relacionamento desta maneira: e E[y
Sem saber nada sobre , é o mais longe que podemos chegar. β j é o efeito em η , na média condicional transformada de y , de um aumento unitário em x j , e o efeito na média condicional de y de um aumento unitário em x j é g - 1 ( β ) .g βj η y xj y xj g−1(β)
Mas você parece estar perguntando especificamente sobre a regressão de Poisson usando a função de link padrão de R, que neste caso é o logaritmo natural. Se for esse o caso, você está perguntando sobre um tipo específico de GLM em que e g = ln . Então podemos obter alguma tração em relação a uma interpretação específica.y∼Poisson(λ) g=ln
Pelo que eu disse acima, sabemos que . E já que sabemosg(μ)=ln(μ), também sabemos queg-1(η)=eη. Também sabemos quedeη∂μ∂xj=dg−1dηβj g(μ)=ln(μ) g−1(η)=eη , então podemos dizer que
∂μdeηdη=eη
o que finalmente significa algo tangível:
E usando a interpretação mais familiarizados mudança de unidade, temos: que significa
Há três peças importantes a serem observadas aqui:
fonte
My suggestion would be to create a small grid consisting of combinations of the two rivers and two or three values of each of the covariates, then use the
predict
function with your grid asnewdata
. Then graph the results. It is much clearer to look at the values that the model actually predicts. You may or may not want to back-transform the predictions to the original scale of measurement (type = "response"
).fonte