Posso obter ajuda para concluir esta tentativa (em andamento) de tentar me orientar sobre os equivalentes da ANOVA e REGRESSION? Eu tenho tentado conciliar os conceitos, nomenclatura e sintaxe dessas duas metodologias. Há muitos posts sobre este local sobre a sua semelhança, por exemplo, este ou esta , mas ainda é bom ter um rápido "você está aqui" Mapa quando começar.
Pretendo atualizar esta postagem e espero obter ajuda para corrigir erros.
ANOVA unidirecional:
Structure: DV is continuous; IV is ONE FACTOR with different LEVELS.
Scenario: miles-per-gal. vs cylinders
Note that Income vs Gender (M, F) is a t-test.
Syntax: fit <- aov(mpg ~ as.factor(cyl), data = mtcars); summary(fit); TukeyHSD(fit)
Regression: fit <- lm(mpg ~ as.factor(cyl), mtcars)
# with F dummy coded;
summary(fit); anova(fit)
ANOVA bidirecional:
Structure: DV is continuous; IV is > 1 FACTORS with different LEVELS.
Scenario: mpg ~ cylinders & carburators
Syntax: fit <- aov(mpg ~ as.factor(cyl) + as.factor(carb), mtcars);
summary(fit); TukeyHSD(fit)
Regression: fit <- lm(mpg ~ as.factor(cyl) + as.factor(carb), mtcars)
# with F dummy coded;
summary(fit); anova(fit)
ANOVA fatorial bidirecional:
Structure: All possible COMBINATIONS of LEVELS are considered.
Scenario: mpg ~ cylinders + carburetors + (4cyl/1,...8cyl/4)
Syntax: fit <- aov(mpg ~ as.factor(cyl) * as.factor(carb), mtcars);
summary(fit); TukeyHSD(fit)
Regression: fit <- lm(mpg ~ as.factor(cyl) * as.factor(carb), mtcars)
# with F dummy coded;
summary(fit); anova(fit)
ANCOVA:
Structure: DV continuous ~ Factor and continuous COVARIATE.
Scenario: mpg ~ cylinders + weight
Syntax: fit <- aov(mpg ~ as.factor(cyl) + wt, mtcars); summary(fit)
Regression: fit <- lm(mpg ~ as.factor(cyl) + wt, mtcars)
# with F dummy coded;
summary(fit); anova(fit)
MANOVA:
Structure: > 1 DVs continuous ~ 1 FACTOR ("One-way") or 2 FACTORS ("Two-way MANOVA").
Scenario: mpg and wt ~ cylinders
Syntax: fit <- manova(cbind(mpg,wt) ~ as.factor(cyl), mtcars); summary(fit)
Regression: N/A
MANCOVA:
Structure: > 1 DVs continuous ~ 1 FACTOR + 1 continuous (covariate) DV.
Scenario: mpg and wt ~ cyl + displacement (cubic inches)
Syntax: fit <- manova(cbind(mpg,wt) ~ as.factor(cyl) + disp, mtcars); summary(fit)
Regression: N/A
DENTRO ANOVA DE FATOR (ou ASSUNTO): ( código aqui )
Structure: DV continuous ~ FACTOR with each level * with subject (repeated observations).
Extension paired t-test. Each subject measured at each level multiple times.
Scenario: Memory rate ~ Emotional value of words for Subjects @ Times
Syntax: fit <- aov(Recall_Rate ~ Emtl_Value * Time + Error(Subject/Time), data);
summary(fit); print(model.tables(fit, "means"), digits=3);
boxplot(Recall_Rate ~ Emtl_Value, data=data)
with(data, interaction.plot(Time, Emtl_Value, Recall_Rate))
with(data, interaction.plot(Subject, Emtl_Value, Recall_Rate))
NOTE: Data should be in the LONG FORMAT (same subject in multiple rows)
Regression: Mixed Effects
require(lme4); require(lmerTest)
fit <- lmer(Recall_Rate ~ Emtl_Value * Time + (1|Subject/Time), data);
anova(fit); summary(fit); coefficients(fit); confint(fit)
or
require(nlme)
fit <- lme(Recall_Rate ~ Emtl_Value * Time, random = ~1|Subject/Time, data)
summary(fit); anova(fit); coefficients(fit); confint(fit)
SPLIT-PLOT: ( código aqui )
Structure: DV continuous ~ FACTOR/-S with RANDOM EFFECTS and pseudoreplication.
Scenario: Harvest yield ~ Factors = Irrigation / Density of seeds / Fertilizer
& RANDOM EFFECTS (Blocks and plots of land):
Syntax: fit <- aov(yield ~ irrigation * density * fertilizer +
Error(block/irrigation/density), data); summary(fit)
Regression: Mixed Effects
require(lme4); require(lmerTest);
fit <- lmer(yield ~ irrigation * fertilizer +
(1|block/irrigation/density), data = splityield);
anova(fit); summary(fit); coefficients(fit); confint(fit)
or
library(nlme)
fit <- lme(yield ~ irrigation * variety, random=~1|field, irrigation)
summary(fit); anova(fit)
PROJETO NESTADO: ( código aqui )
Structure: DV continuous ~ FACTOR/-S with pseudoreplication.
Scenario: [Glycogen] ~ Factors = Treatment & RANDOM EFFECTS with Russian-doll effect:
Six rats (6 Livers)-> 3 Microscopic Slides/Liver-> 2 Readings/Slide).
Syntax: fit <- aov(Glycogen ~ Treatment + Error(Rat/Liver), data); summary(fit)
Regression: Mixed Effects
require(lme4); require(lmerTest)
fit <- lmer(Glycogen ~ Treatment + (1|Rat/Liver), rats);
anova(fit); summary(fit); coefficients(fit); confint(fit)
or
require(nlme)
fit<-lme(Glycogen ~ Treatment, random=~1|Rat/Liver, rats)
summary(fit); anova(fit); VarCorr(fit)
SITES ÚTEIS:
regression
anova
mixed-model
Antoni Parellada
fonte
fonte
cyl + hp
. Horespower é contínuo, então não funciona aqui.carb
, o número de carburadores seria uma escolha melhor.Respostas:
Boa lista, Antoni. Aqui estão algumas sugestões menores:
ANOVA unidirecional: IV é um fator com 3 ou mais níveis. Você também pode adicionar um exemplo de dados: mtcars a esta entrada. (Da mesma forma, você pode adicionar instruções * Dados de Exemplo "a todas as suas entradas, para esclarecer quais conjuntos de dados você está usando.)
Anova de duas vias: por que não usar IV1 e IV2 e afirmar que as duas variáveis independentes devem ser fatores com pelo menos dois níveis cada? A maneira como você afirma isso atualmente sugere que uma anova bidirecional pode incluir mais de 2 variáveis independentes (ou fatores), o que não é sensorial.
Para a Anova de duas vias, eu diferenciaria entre esses dois sub-casos: 1. Anova de duas vias com efeitos principais para IV1 e IV2 e 2. Anova de duas vias com uma interação entre IV1 e IV2. Este segundo item é o que você está chamando de dois como anova fatorial de duas vias.) Uma maneira melhor de descrever esses dois sub-casos seria: 1. O efeito de IV1 no DV é independente do efeito de IV2 e 2. Efeito de IV1 no DV depende do IV2. Você também pode deixar mais claro que são as variáveis independentes IV1 e IV2 que são codificadas como dummy na configuração de regressão.
Para a ANCOVA, você pode esclarecer que está considerando apenas a ANCOVA unidirecional no seu exemplo atual. Para garantir a integridade, você pode adicionar um exemplo ANCOVA bidirecional sem interações entre IV1 e IV2 e outro com interação entre essas duas variáveis.
Para todas as opções acima, você também pode adicionar um item chamado Finalidade , que descreve quando essas análises são úteis. Por exemplo:
Objetivo (da anova de mão única): Investigue se os valores médios do VD são diferentes nos níveis do IV.
Para o MANOVA, você pode esclarecer que seria necessário (a) dois ou mais DVs e (2) um ou mais IVs, que são fatores? Eu acho que você pode diferenciar entre MANOVA unidirecional (com 1 fator) e MANOVA bidirecional? A mesma coisa para MANCOVA.
A ANOVA DENTRO DO FATOR também é conhecida como ANOVA DE MEDIDAS REPETIDAS; portanto, talvez você possa adicionar essa terminologia à sua lista para aqueles que a conhecem. Também seria útil esclarecer que a modelagem de efeitos mistos fornece uma maneira alternativa de modelar dados de medidas repetidas. Caso contrário, os leitores podem não apreciar a diferença entre as duas abordagens.
fonte