Interpretação da saída .L & .Q de um GLM binomial negativo com dados categóricos

14

Acabei de executar um GLM binomial negativo e esta é a saída:

Call:
glm.nb(formula = small ~ method + site + depth, data = size.dat, 
    init.theta = 1.080668549, link = log)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-2.2452  -0.9973  -0.3028   0.3864   1.8727  

Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)   1.6954     0.1152  14.720  < 2e-16 ***
method.L     -0.6828     0.1637  -4.171 3.04e-05 ***
site.L        0.9952     0.2050   4.854 1.21e-06 ***
site.Q       -0.4634     0.1941  -2.387    0.017 *  
depth.L       0.8951     0.1988   4.502 6.74e-06 ***
depth.Q       0.2060     0.1984   1.038    0.299    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

(Dispersion parameter for Negative Binomial(1.0807) family taken to be 1)

    Null deviance: 185.1  on 89  degrees of freedom
Residual deviance: 100.8  on 84  degrees of freedom
AIC: 518.24

Meus preditores são todos categóricos. É por isso que estou recebendo .Le .Q. Presumo que eles representam as diferentes categorias, mas alguém conhece um código que eu possa usar para rotulá-los antes de executar o GLM, para que eles apareçam como as diferentes categorias?

Vivienne
fonte
Acho esse código bastante confuso. Existe um código mais simples? As categorias são muito simples: método 1 e método 2, site 1, site2 e site 3 e a profundidade é 5, 10 e 15
Vivienne
ats.ucla.edu/stat/r/library/contrast_coding.htm#SIMPLE - ou ats.ucla.edu/stat/r/library/contrast_coding.htm#dummy , que é o padrão para fatores não ordenados em glm.
Scortchi - Restabelece Monica

Respostas:

12

Suas variáveis ​​não são apenas codificadas como fatores (para torná-las categóricas), elas são codificadas como fatores ordenados . Então, por padrão, R ajusta uma série de funções polinomiais aos níveis da variável. O primeiro é linear ( .L), o segundo é quadrático ( .Q), o terceiro (se você tiver níveis suficientes) seria cúbico, etc. R ajustará uma função polinomial a menos do que o número de níveis em sua variável. Por exemplo, se você tiver apenas dois níveis, apenas a tendência linear seria adequada. Além disso, as bases polinomiais utilizadas são ortogonais. (Pelo que vale, nada disso é específico para R - ou para modelos binomiais negativos - todos os softwares e tipos de modelos de regressão fariam o mesmo.)


Concentrando-se especificamente em R, se você queria suas variáveis a serem codificadas como ordenada ou desordenada, você usaria fator? :

my.variable <- factor(my.variable, ordered=TRUE)   # an ordered factor
my.variable <- factor(my.variable, ordered=FALSE)  # an unordered factor
- Reinstate Monica
fonte
Oh, eu tinha pedido agora, está com os rótulos, muito obrigado!
Vivienne