Diferença nos valores de p reportados entre lm e aov em R

12

O que explica as diferenças nos valores de p no seguinte aove nas lmchamadas? A diferença é apenas devido a diferentes tipos de cálculos de somas de quadrados?

set.seed(10)
data=rnorm(12)
f1=rep(c(1,2),6)
f2=c(rep(1,6),rep(2,6))
summary(aov(data~f1*f2))
summary(lm(data~f1*f2))$coeff
Remi.b
fonte

Respostas:

13

summary(aov)usa somas de quadrados do tipo I (seqüenciais). summary(lm)usa somas de quadrados do Tipo III, que não são seqüenciais. Veja a resposta do gung para detalhes.


lm(data ~ factor(f1) * factor(2))aov()t

t=ψ^ψ0σ^c(XX)1c

c(XX)1cβcF

caracal
fonte
1
Eu acho que a primeira frase desta resposta está errada. A diferença parece ser precisamente devida a diferentes tipos de soma de quadrados: tipo I vs. tipo II / III. O tipo I é seqüencial, que é o que lminforma, enquanto o tipo II / III não. Isso é explicado com bastante detalhes na resposta do @ gung à qual você vinculou.
Ameba diz Reinstate Monica
@amoeba O que você sugere para corrigir a resposta?
Caracal
Editei o primeiro parágrafo, veja se você concorda com a edição e sinta-se à vontade para alterá-la como quiser.
Ameba diz Reinstate Monica
2
set.seed(10)
data=rnorm(12)
f1=rep(c(1,2),6)
f2=c(rep(1,6),rep(2,6))
summary(aov(data~f1*f2))
            Df Sum Sq Mean Sq F value Pr(>F)
f1           1  0.535  0.5347   0.597  0.462
f2           1  0.002  0.0018   0.002  0.966
f1:f2        1  0.121  0.1208   0.135  0.723
Residuals    8  7.169  0.8962               
summary(lm(data~f1*f2))$coeff
               Estimate Std. Error    t value  Pr(>|t|)
(Intercept)  0.05222024   2.732756  0.0191090 0.9852221
f1          -0.17992329   1.728346 -0.1041014 0.9196514
f2          -0.62637109   1.728346 -0.3624106 0.7264325
f1:f2        0.40139439   1.093102  0.3672066 0.7229887

Estes são dois códigos diferentes. do modelo Lm, você precisa dos coeficientes. enquanto no modelo aov você está apenas tabulando as fontes de variação. Experimente o código

anova(lm(data~f1*f2))
Analysis of Variance Table

Response: data
          Df Sum Sq Mean Sq F value Pr(>F)
f1         1 0.5347 0.53468  0.5966 0.4621
f2         1 0.0018 0.00177  0.0020 0.9657
f1:f2      1 0.1208 0.12084  0.1348 0.7230
Residuals  8 7.1692 0.89615   

Isso fornece a tabulação das fontes de variação, levando aos mesmos resultados.

user157663
fonte
2
Isso não parece responder à pergunta, que pergunta por que os valores-p f1e f2diferem nos dois resumos do seu painel superior. Parece que você está mostrando apenas que summary(aov(...))e anova(lm(...))em Rter uma saída similar.
whuber