Como interpretar ANOVA e MANOVA do tipo I, tipo II e tipo III?

45

Minha pergunta principal é como interpretar a saída (coeficientes, F, P) ao realizar uma ANOVA tipo I (seqüencial)?

Meu problema de pesquisa específico é um pouco mais complexo, então vou dividir meu exemplo em partes. Primeiro, se estou interessado no efeito da densidade da aranha (X1) no crescimento das plantas (Y1) e plantei mudas em cercos e manipulei a densidade da aranha, então posso analisar os dados com uma ANOVA simples ou regressão linear. Então, não importa se eu usei Soma dos Quadrados Tipo I, II ou III (SS) na minha ANOVA. No meu caso, tenho 4 réplicas de 5 níveis de densidade, para que eu possa usar a densidade como um fator ou como uma variável contínua. Nesse caso, prefiro interpretá-lo como uma variável independente contínua (preditora). No RI pode executar o seguinte:

lm1 <- lm(y1 ~ density, data = Ena)
summary(lm1)
anova(lm1)

A execução da função anova fará sentido para comparação posteriormente, espero, portanto, ignore a estranheza dela aqui. A saída é:

Response: y1
          Df  Sum Sq Mean Sq F value  Pr(>F)  
density    1 0.48357 0.48357  3.4279 0.08058 .
Residuals 18 2.53920 0.14107 

Agora, digamos que eu suspeito que o nível inicial de nitrogênio inorgânico no solo, que eu não conseguia controlar, também tenha afetado significativamente o crescimento das plantas. Não estou particularmente interessado nesse efeito, mas gostaria de explicar a variação que ele causa. Realmente, meu principal interesse é nos efeitos da densidade de aranhas (hipótese: aumento da densidade de aranhas causa aumento de plantas - presumivelmente através da redução de insetos herbívoros, mas estou testando apenas o efeito, e não o mecanismo). Eu poderia adicionar o efeito de N inorgânico à minha análise.

Para o bem da minha pergunta, vamos fingir que eu testei a densidade de interação * inorganicN e ela não é significativa; por isso, removo-a da análise e execute os seguintes efeitos principais:

> lm2 <- lm(y1 ~ density + inorganicN, data = Ena)
> anova(lm2)
Analysis of Variance Table

Response: y1
           Df  Sum Sq Mean Sq F value  Pr(>F)  
density     1 0.48357 0.48357  3.4113 0.08223 .
inorganicN  1 0.12936 0.12936  0.9126 0.35282  
Residuals  17 2.40983 0.14175 

Agora, faz diferença se eu uso SS Tipo I ou Tipo II (sei que algumas pessoas se opõem aos termos Tipo I e II etc., mas, dada a popularidade do SAS, é fácil abreviar). Renova {stats} usa o Tipo I por padrão. Posso calcular o SS do tipo II, F e P para a densidade, revertendo a ordem dos meus efeitos principais ou posso usar o pacote "car" do Dr. John Fox (associado à regressão aplicada). Prefiro o último método, pois é mais fácil para problemas mais complexos.

library(car)
Anova(lm2)
            Sum Sq Df F value  Pr(>F)  
density    0.58425  1  4.1216 0.05829 .
inorganicN 0.12936  1  0.9126 0.35282  
Residuals  2.40983 17  

Meu entendimento é que as hipóteses do tipo II seriam: "Não há efeito linear de x1 em y1, dado o efeito de (manter constante?) X2" e o mesmo para x2, dado x1. Acho que é aqui que fico confuso. Qual é a hipótese que está sendo testada pela ANOVA, usando o método do tipo I (sequencial) acima, em comparação com a hipótese do método do tipo II?

Na realidade, meus dados são um pouco mais complexos, porque medi inúmeras métricas de crescimento de plantas, dinâmica de nutrientes e decomposição de lixo. Minha análise real é algo como:

Y <- cbind(y1 + y2 + y3 + y4 + y5)
# Type II
mlm1 <- lm(Y ~ density + nitrate + Npred, data = Ena)
Manova(mlm1)

Type II MANOVA Tests: Pillai test statistic
        Df test stat approx F num Df den Df  Pr(>F)    
density  1   0.34397        1      5     12 0.34269    
nitrate  1   0.99994    40337      5     12 < 2e-16 ***
Npred    1   0.65582        5      5     12 0.01445 * 


# Type I
maov1 <- manova(Y ~ density + nitrate + Npred, data = Ena)
summary(maov1)

          Df  Pillai approx F num Df den Df  Pr(>F)    
density    1 0.99950     4762      5     12 < 2e-16 ***
nitrate    1 0.99995    46248      5     12 < 2e-16 ***
Npred      1 0.65582        5      5     12 0.01445 *  
Residuals 16                                           
djhocking
fonte

Respostas:

71

nn11n12n21n22r=.1ré "significativo", esta é toda a população com a qual você se importa). O problema com seus fatores sendo correlacionados é que existem somas de quadrados associadas a A e B. Ao calcular uma ANOVA (ou qualquer outra regressão linear), queremos particionar as somas de quadrados. Uma partição coloca todas as somas de quadrados em um e apenas umde vários subconjuntos. (Por exemplo, podemos querer dividir o SS em A, B e erro.) No entanto, como seus fatores (ainda apenas A e B aqui) não são ortogonais, não existe uma partição exclusiva desses SS. De fato, pode haver muitas partições, e se você estiver disposto a dividir seu SS em frações (por exemplo, "eu colocarei .5 nessa lixeira e .5 nessa"), existem infinitas partições. Uma maneira de visualizar isso é imaginar o símbolo MasterCard: O retângulo representa o SS total e cada um dos círculos representa o SS atribuível a esse fator, mas observe a sobreposição entre os círculos no centro, esses SS podem receber para qualquer círculo.

insira a descrição da imagem aqui

A questão é: como devemos escolher a partição "certa" dentre todas essas possibilidades? Vamos trazer a interação de volta e discutir algumas possibilidades:

SS tipo I:

  • SS (A)
  • SS (B | A)
  • SS (A * B | A, B)

SS tipo II:

  • SS (A | B)
  • SS (B | A)
  • SS (A * B | A, B)

SS tipo III:

  • SS (A | B, A * B)
  • SS (B | A, A * B)
  • SS (A * B | A, B)

Observe como essas diferentes possibilidades funcionam. Somente o SS tipo I realmente usa esses SS na parte sobreposta entre os círculos no símbolo MasterCard. Ou seja, o SS que pode ser atribuído a A ou B, na verdade , é atribuído a um deles quando você usa SS tipo I (especificamente, aquele que você inseriu no modelo primeiro). Em ambas as outras abordagens, o SS sobreposição não são usados em todos . Assim, o SS tipo I fornece a A todo o SS atribuível a A (incluindo aqueles que também poderiam ter sido atribuídos em outro lugar), depois fornece a B todos os SS restantes atribuíveis a B e, em seguida, fornece à interação A * B do restanteSS que são atribuíveis a A * B e deixam as sobras que não puderam ser atribuídas a nada no termo do erro.

SS tipo III apenas fornece A aqueles SS que são atribuíveis exclusivamente a A, da mesma forma que apenas fornece a B e a interação aqueles SS que são atribuídos exclusivamente a eles. O termo de erro obtém apenas os SS que não puderam ser atribuídos a nenhum dos fatores. Assim, aqueles SS 'ambíguos' que poderiam ser atribuídos a 2 ou mais possibilidades não são utilizados. Se você somar o SS do tipo III em uma tabela ANOVA, notará que eles não são iguais ao total de SS. Em outras palavras, essa análise deve estar errada, mas erra de uma maneira epistemicamente conservadora. Muitos estatísticos acham essa abordagem flagrante, no entanto, as agências de financiamento do governo (acredito que o FDA) exigem seu uso.

A abordagem do tipo II visa capturar o que pode valer a pena sobre a idéia por trás do tipo III, mas mitigar seus excessos. Especificamente, apenas ajusta o SS para A e B um para o outro, não para a interação. No entanto, na prática, o SS tipo II nunca é essencialmente utilizado. Você precisaria saber sobre tudo isso e ter conhecimento o suficiente do seu software para obter essas estimativas, e os analistas que normalmente pensam que isso é uma besteira.

Existem mais tipos de SS (acredito IV e V). Eles foram sugeridos no final dos anos 60 para lidar com certas situações, mas mais tarde foi mostrado que eles não fazem o que se pensava. Portanto, neste momento, eles são apenas uma nota de rodapé histórica.

Quanto às perguntas que estão respondendo, você basicamente já tem esse direito na sua pergunta:

  • As estimativas usando o SS tipo I informam quanto da variabilidade em Y pode ser explicada por A, quanto da variabilidade residual pode ser explicada por B, quanto da variabilidade residual restante pode ser explicada pela interação e assim por diante, em ordem .
  • As estimativas baseadas no SS do tipo III indicam quanto da variabilidade residual em Y pode ser explicada por A depois de ter contabilizado tudo o resto e quanto da variabilidade residual em Y pode ser contabilizada por B depois de ter contabilizado todo o resto também e assim por diante. (Observe que ambos passam primeiro e duram simultaneamente; se isso faz sentido para você e reflete com precisão sua pergunta de pesquisa, use o tipo III SS.)
- Reinstate Monica
fonte
2
obrigado pela resposta muito útil. A outra área em que eu fico confuso é que, se "Estimativas usando SS tipo I dizem quanto da variabilidade em Y pode ser explicada por A, quanto da variabilidade residual pode ser explicada por B, quanto do restante residual a variabilidade pode ser explicada pela interação, e assim por diante, em ordem ", então por que as estatísticas se associam a A mudam quando variáveis ​​adicionais são adicionadas? É porque os testes são baseados em SS (A) / SS (erro) e o erro é uma função de todos os termos do modelo? Estou pensando nisso corretamente?
djhocking
1
Por "estatísticas associadas a A", eu interpreto você como os valores F e p para o efeito principal de A. O valor F para A é a razão entre o quadrado médio de A (ou seja, SSA / dfA) e o Erro de MS. À medida que você adiciona mais fatores, os SS são retirados do termo do erro e dados a esses fatores. Em geral, isso significa que o erro do MS diminui e, portanto, a proporção aumenta. Como resultado, o valor F para A aumenta e o valor p diminui. Como os graus de liberdade também mudam, pode ser mais complicado do que isso, mas essa é a essência.
gung - Restabelece Monica
Opa, eu quis dizer MS (A) / MSE para a estatística F. De qualquer forma, sua resposta é perfeita, obrigado novamente por toda a sua ajuda!
djhocking
Estou curioso sobre os detalhes da interpretação ao usar o tipo I. No meu caso, a densidade é minha única variável de interesse e a única que manipulei experimentalmente. Por mais infeliz que seja, a densidade é insignificante por si só ou depois de contabilizar minhas outras duas variáveis ​​de interesse (Npredators, inorgânicosN no tipo II ou III). Mas, como inorganicN aparentemente explica grande parte da variação de algumas variáveis ​​dependentes, quando a adiciono como terceira variável, torna as outras duas altamente significativas. Portanto, a densidade realmente tem um efeito significativo em Y? Isso é razoável?
precisa saber é o seguinte
2
@ JonBonJovi, a analogia da MasterCard possui apenas 2 fatores. Se você quiser 2 fatores mais uma interação, precisará de 3 áreas que se sobrepõem um pouco. Certamente é possível desenhar um diagrama de Euler com 3 áreas, mas eu apenas usei o símbolo MasterCard para simplificar. Para uma interação, imagine um terceiro círculo que se sobreponha aos 2 primeiros (por exemplo, ele pode ser centralizado da direita para a esquerda, mas principalmente acima dos outros); então todo o círculo A (SS) iria para A, tudo em B que não se sobrepõe A vai para B e tudo em A B que não se sobrepõe * A ou B vai para a interação.
gung - Restabelece Monica