Como posso testar efeitos em uma ANOVA de plotagem dividida usando comparações de modelos adequadas para uso com os argumentos X
e em R? Estou familiarizado com Dalgaard (2007) [1]. Infelizmente, ele apenas modela os designs de plotagem dividida. Fazendo isso em um design totalmente aleatório, com dois fatores internos:M
anova.mlm()
?anova.mlm
N <- 20 # 20 subjects total
P <- 3 # levels within-factor 1
Q <- 3 # levels within-factor 2
DV <- matrix(rnorm(N* P*Q), ncol=P*Q) # random data in wide format
id <- expand.grid(IVw1=gl(P, 1), IVw2=gl(Q, 1)) # intra-subjects layout of data matrix
library(car) # for Anova()
fitA <- lm(DV ~ 1) # between-subjects design: here no between factor
resA <- Anova(fitA, idata=id, idesign=~IVw1*IVw2)
summary(resA, multivariate=FALSE, univariate=TRUE) # all tests ...
As comparações de modelo a seguir levam aos mesmos resultados. O modelo restrito não inclui o efeito em questão, mas todos os outros efeitos da mesma ordem ou inferior, o modelo completo adiciona o efeito em questão.
anova(fitA, idata=id, M=~IVw1 + IVw2, X=~IVw2, test="Spherical") # IVw1
anova(fitA, idata=id, M=~IVw1 + IVw2, X=~IVw1, test="Spherical") # IVw2
anova(fitA, idata=id, M=~IVw1 + IVw2 + IVw1:IVw2,
X=~IVw1 + IVw2, test="Spherical") # IVw1:IVw2
Um design Split-Splot com um fator interno e um fator entre sujeitos:
idB <- subset(id, IVw2==1, select="IVw1") # use only first within factor
IVb <- gl(2, 10, labels=c("A", "B")) # between-subjects factor
fitB <- lm(DV[ , 1:P] ~ IVb) # between-subjects design
resB <- Anova(fitB, idata=idB, idesign=~IVw1)
summary(resB, multivariate=FALSE, univariate=TRUE) # all tests ...
Estes são os anova()
comandos para replicar os testes, mas não sei por que eles funcionam. Por que os testes das seguintes comparações de modelos levam aos mesmos resultados?
anova(fitB, idata=idB, X=~1, test="Spherical") # IVw1, IVw1:IVb
anova(fitB, idata=idB, M=~1, test="Spherical") # IVb
Dois fatores entre sujeitos e um fator entre sujeitos:
fitC <- lm(DV ~ IVb) # between-subjects design
resC <- Anova(fitC, idata=id, idesign=~IVw1*IVw2)
summary(resC, multivariate=FALSE, univariate=TRUE) # all tests ...
Como replico os resultados fornecidos acima com as comparações de modelos correspondentes para uso com os argumentos X
e M
de anova.mlm()
? Qual é a lógica por trás dessas comparações de modelos?
EDIT: suncoolsu apontou que, para todos os efeitos práticos, os dados desses projetos devem ser analisados usando modelos mistos. No entanto, eu ainda gostaria de entender como replicar os resultados summary(Anova())
com anova.mlm(..., X=?, M=?)
.
[1]: Dalgaard, p. 2007. Novas funções para análise multivariada. R News, 7 (2), 2-7.
lme4
pacote para se ajustar ao modelo E NÃOlm
. Mas essa pode ser uma visão baseada em livro muito específica. Vou deixar outro comentário sobre isso. Eu posso dar um exemplo baseado em como eu o interpreto, que é diferente do seu.Respostas:
O
X
eM
basicamente especificam os dois modelos que você deseja comparar, mas apenas em termos dos efeitos dentro do assunto; em seguida, mostra resultados para a interação de todos os efeitos entre sujeitos (incluindo a interceptação) com os efeitos dentro dos sujeitos que foram alterados entreX
eM
.Seus exemplos
fitB
são mais fáceis de entender se adicionarmos os padrões paraX
eM
:O primeiro modelo é a mudança de efeitos não internos (todos têm a mesma média) para uma média diferente para cada um, por isso adicionamos o
id
efeito aleatório, que é a coisa certa para testar a interceptação geral e o geral entre os efeitos sujeitos em.O segundo modelo anuncia a
id:IVw1
interação, que é a coisa certa a ser testadaIVw1
e osIVw1:IVb
termos contra. Como existe apenas um efeito dentro do assunto (com três níveis), o padrão dodiag(3)
segundo modelo será responsável por isso; seria equivalente a correrPara você
fitC
, acredito que esses comandos recriarão oAnova
resumo.Agora, como você descobriu, esses comandos são realmente complicados. Felizmente, não há mais motivos para usá-los. Se você estiver disposto a assumir a esfericidade, use apenas
aov
ou, para uma sintaxe ainda mais fácil, uselm
e calcule os testes F corretos. Se você não está disposto a assumir a esfericidade, usarlme
é realmente o caminho a seguir, pois você obtém muito mais flexibilidade do que nas correções de GG e HF.Por exemplo, aqui está o código
aov
elm
para o seufitA
. Você precisa ter os dados em formato longo primeiro; Aqui está uma maneira de fazer isso:E aqui está o
lm and
código aov`:fonte
anova()
causa do problemaAnova()
descrito aqui . Mas sua última sugestão funciona tão bem quanto é mais simples. (Minor coisa: Eu acho que os últimos 2 linhas são cada faltando 1 parêntese de fechamento, e deve lerError(id/(IVw1*IVw2))
)Os projetos de parcelas subdivididas se originaram na agricultura, daí o nome. Mas eles freqüentemente ocorrem, e eu diria - o cavalo de batalha da maioria dos ensaios clínicos. A plotagem principal é tratada com um nível de um fator, enquanto os níveis de algum outro fator podem variar com as subparcelas. O design surge como resultado de restrições em uma randomização completa. Por exemplo: um campo pode ser dividido em quatro subparcelas. Pode ser possível plantar variedades diferentes em subparcelas, mas apenas um tipo de irrigação pode ser usado para todo o campo. Não é a distinção entre divisões e blocos. Blocos são características das unidades experimentais das quais temos a opção de aproveitar o design experimental, porque sabemos que elas estão lá. As divisões, por outro lado, impõem restrições sobre quais atribuições de fatores são possíveis. Eles impõem requisitos no design que impedem uma randomização completa.
Eles são muito utilizados em ensaios clínicos em que quando um fator é fácil de alterar, enquanto outro fator leva muito mais tempo para mudar. Se o experimentador precisar executar todas as execuções para cada nível do fator difícil de alterar consecutivamente, um design de plotagem dividida resultará em um fator de difícil alteração que representa o fator inteiro da plotagem.
Aqui está um exemplo: Em um teste de campo agrícola, o objetivo era determinar os efeitos de duas variedades de culturas e quatro métodos diferentes de irrigação. Oito campos estavam disponíveis, mas apenas um tipo de irrigação pode ser aplicado a cada campo. Os campos podem ser divididos em duas partes com uma variedade diferente em cada parte. Todo o fator de plotagem é a irrigação, que deve ser atribuída aleatoriamente aos campos. Dentro de cada campo, a variedade é atribuída.
É assim que você faz isso
R
:Basicamente, o que este modelo diz é que a irrigação e a variedade são efeitos fixos e a variedade é aninhada na irrigação. Os campos são os efeitos aleatórios e pictoricamente serão algo como
Mas essa era uma variante especial com efeito fixo de plotagem e efeito de plotagem inteira. Pode haver variantes nas quais uma ou mais são aleatórias. Pode haver designs mais complicados, como split-split .. plot designs. Basicamente, você pode ir selvagem e louco. Mas, dada a estrutura e a distribuição subjacentes (ou seja, fixa ou aleatória, aninhada ou cruzada, etc.) é claramente entendida, a
lmer-Ninja
não terá problemas na modelagem. Pode ser que a interpretação seja uma bagunça.Em relação às comparações, diga que você tem
lmer1
elmer2
:fornecerá o teste apropriado com base na estatística do teste qui-quadrado com graus de liberdade iguais à diferença de parâmetros.
cf: Faraway, J., Estendendo modelos lineares com R.
Casella, G., Desenho Estatístico
fonte