Acabei de executar um GLM binomial negativo e esta é a saída:
Call:
glm.nb(formula = small ~ method + site + depth, data = size.dat,
init.theta = 1.080668549, link = log)
Deviance Residuals:
Min 1Q Median 3Q Max
-2.2452 -0.9973 -0.3028 0.3864 1.8727
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 1.6954 0.1152 14.720 < 2e-16 ***
method.L -0.6828 0.1637 -4.171 3.04e-05 ***
site.L 0.9952 0.2050 4.854 1.21e-06 ***
site.Q -0.4634 0.1941 -2.387 0.017 *
depth.L 0.8951 0.1988 4.502 6.74e-06 ***
depth.Q 0.2060 0.1984 1.038 0.299
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for Negative Binomial(1.0807) family taken to be 1)
Null deviance: 185.1 on 89 degrees of freedom
Residual deviance: 100.8 on 84 degrees of freedom
AIC: 518.24
Meus preditores são todos categóricos. É por isso que estou recebendo .L
e .Q
. Presumo que eles representam as diferentes categorias, mas alguém conhece um código que eu possa usar para rotulá-los antes de executar o GLM, para que eles apareçam como as diferentes categorias?
glm
.Respostas:
Suas variáveis não são apenas codificadas como fatores (para torná-las categóricas), elas são codificadas como fatores ordenados . Então, por padrão, R ajusta uma série de funções polinomiais aos níveis da variável. O primeiro é linear (
.L
), o segundo é quadrático (.Q
), o terceiro (se você tiver níveis suficientes) seria cúbico, etc. R ajustará uma função polinomial a menos do que o número de níveis em sua variável. Por exemplo, se você tiver apenas dois níveis, apenas a tendência linear seria adequada. Além disso, as bases polinomiais utilizadas são ortogonais. (Pelo que vale, nada disso é específico para R - ou para modelos binomiais negativos - todos os softwares e tipos de modelos de regressão fariam o mesmo.)Concentrando-se especificamente em R, se você queria suas variáveis a serem codificadas como ordenada ou desordenada, você usaria fator? :
fonte