Como usar o anova para comparação de dois modelos?

9

Como devo entender o anovaresultado ao comparar dois modelos?

Exemplo:

  Res.Df    RSS Df Sum of Sq      F    Pr(>F)    
1      9 54.032                                  
2      7  4.632  2      49.4 37.329 0.0001844 ***

A página de manual declara: "Computar tabelas de análise de variação (ou desvio) para um ou mais objetos de modelo ajustados". No entanto, um professor mencionou que pode ser empregado para comparação de modelos - é isso que pretendo fazer.

Por isso, presumo que eu poderia usar anova(model1, model2)e obter um valor-p que me diz se devo rejeitar a hipótese nula: "os modelos são os mesmos".

Posso afirmar que, se o valor-p for menor que (digamos) 0,05, os modelos diferem significativamente?

petrbel
fonte
No seu exemplo, model1 e model2 estão aninhados? Ou seja, ambos os modelos têm um conjunto compartilhado de variáveis ​​preditivas e a mesma variável de resultado, mas um modelo possui uma ou mais variáveis ​​preditivas adicionais?
EdM
Um é como Y ~ X + X^2e o segundoY ~ X + X^2 + X^3
petrbel

Respostas:

13

Supondo que seus modelos estão aninhados (ou seja, a mesma variável de resultado e o modelo 2 contém todas as variáveis ​​do modelo 1 mais 2 variáveis ​​adicionais), os resultados da ANOVA indicam que as 2 variáveis ​​adicionais representam conjuntamente uma variação suficiente para que você possa rejeitar a hipótese nula de que o coeficientes para ambas as variáveis ​​são iguais a 0. Isso é efetivamente o que você disse. Se ambos os coeficientes forem iguais a 0, os modelos serão os mesmos.

Modeeu1 1:y=uma+bx1 1+cx2+dx3;Modeeu2:y=uma+bx1 1+cx2x3car::Anovaanova

le_andrew
fonte
Se eu entendi direito, o valor de p menor que 0,05 prova que os modelos são diferentes, justos?
Petrbel
3
Eu não usaria essas palavras (ou seja, "prove" e "modelos diferem"), mas queremos dizer a mesma coisa. Eu diria que seus dados não suportam a hipótese nula de que os coeficientes são ambos 0 ou que os dados suportam a hipótese alternativa de que os coeficientes não são os dois 0
le_andrew
11
Antes de se afirmar que os modelos são diferentes ou que a hipótese nula não é suportada, certifique-se de que os dados atendam razoavelmente às suposições da ANOVA subjacentes ao cálculo e interpretação dos valores de p.
EdM
Só para ter certeza, a última parte sobre a soma dos quadrados do tipo I se aplica apenas à situação em que anova()é usado em um modelo?
Jasper