Sopa de Letrinhas ANOVA Soup & Regression Equivalents

18

Posso obter ajuda para concluir esta tentativa (em andamento) de tentar me orientar sobre os equivalentes da ANOVA e REGRESSION? Eu tenho tentado conciliar os conceitos, nomenclatura e sintaxe dessas duas metodologias. Há muitos posts sobre este local sobre a sua semelhança, por exemplo, este ou esta , mas ainda é bom ter um rápido "você está aqui" Mapa quando começar.

Pretendo atualizar esta postagem e espero obter ajuda para corrigir erros.

ANOVA unidirecional:

Structure:   DV is continuous; IV is ONE FACTOR with different LEVELS.
Scenario:    miles-per-gal. vs cylinders
             Note that Income vs Gender (M, F) is a t-test.
Syntax:      fit <- aov(mpg ~ as.factor(cyl), data = mtcars); summary(fit); TukeyHSD(fit)
Regression:  fit <- lm(mpg ~ as.factor(cyl), mtcars) 
             # with F dummy coded;
             summary(fit); anova(fit)

ANOVA bidirecional:

Structure:   DV is continuous; IV is > 1 FACTORS with different LEVELS.
Scenario:    mpg ~ cylinders & carburators
Syntax:      fit <- aov(mpg ~ as.factor(cyl) + as.factor(carb), mtcars); 
             summary(fit); TukeyHSD(fit)
Regression:  fit <- lm(mpg ~ as.factor(cyl) + as.factor(carb), mtcars) 
             # with F dummy coded; 
             summary(fit); anova(fit)

ANOVA fatorial bidirecional:

Structure:   All possible COMBINATIONS of LEVELS are considered.
Scenario:    mpg ~ cylinders + carburetors + (4cyl/1,...8cyl/4)
Syntax:      fit <- aov(mpg ~ as.factor(cyl) * as.factor(carb), mtcars); 
             summary(fit); TukeyHSD(fit)
Regression:  fit <- lm(mpg ~ as.factor(cyl) * as.factor(carb), mtcars) 
             # with F dummy coded; 
             summary(fit); anova(fit)

ANCOVA:

Structure:   DV continuous ~ Factor and continuous COVARIATE.
Scenario:    mpg ~ cylinders + weight
Syntax:      fit <- aov(mpg ~ as.factor(cyl) + wt, mtcars); summary(fit)
Regression:  fit <- lm(mpg ~ as.factor(cyl) + wt, mtcars) 
             # with F dummy coded; 
             summary(fit); anova(fit)

MANOVA:

Structure:   > 1 DVs continuous ~ 1 FACTOR ("One-way") or 2 FACTORS ("Two-way MANOVA").
Scenario:    mpg and wt ~ cylinders
Syntax:      fit <- manova(cbind(mpg,wt) ~ as.factor(cyl), mtcars); summary(fit)
Regression:  N/A

MANCOVA:

Structure:   > 1 DVs continuous ~ 1 FACTOR + 1 continuous (covariate) DV.
Scenario:    mpg and wt ~ cyl + displacement (cubic inches)
Syntax:      fit <- manova(cbind(mpg,wt) ~ as.factor(cyl) + disp, mtcars); summary(fit)
Regression:  N/A

DENTRO ANOVA DE FATOR (ou ASSUNTO): ( código aqui )

Structure:   DV continuous ~ FACTOR with each level * with subject (repeated observations).
             Extension paired t-test. Each subject measured at each level multiple times. 
Scenario:    Memory rate ~ Emotional value of words for Subjects @ Times
Syntax:      fit <- aov(Recall_Rate ~ Emtl_Value * Time + Error(Subject/Time), data); 
             summary(fit); print(model.tables(fit, "means"), digits=3);
             boxplot(Recall_Rate ~ Emtl_Value, data=data)
             with(data, interaction.plot(Time, Emtl_Value, Recall_Rate))
             with(data, interaction.plot(Subject, Emtl_Value, Recall_Rate))
             NOTE: Data should be in the LONG FORMAT (same subject in multiple rows)
Regression:  Mixed Effects
             require(lme4); require(lmerTest)
             fit <- lmer(Recall_Rate ~ Emtl_Value * Time + (1|Subject/Time), data); 
             anova(fit); summary(fit); coefficients(fit); confint(fit) 
or
             require(nlme)
             fit <- lme(Recall_Rate ~ Emtl_Value * Time, random = ~1|Subject/Time, data)
             summary(fit); anova(fit); coefficients(fit); confint(fit)

SPLIT-PLOT: ( código aqui )

Structure:   DV continuous ~ FACTOR/-S with RANDOM EFFECTS and pseudoreplication.
Scenario:    Harvest yield ~ Factors = Irrigation / Density of seeds / Fertilizer 
                 & RANDOM EFFECTS (Blocks and plots of land): 
Syntax:      fit <- aov(yield ~ irrigation * density * fertilizer + 
                 Error(block/irrigation/density), data); summary(fit)
Regression:  Mixed Effects
             require(lme4); require(lmerTest); 
             fit <- lmer(yield ~ irrigation * fertilizer + 
             (1|block/irrigation/density), data = splityield); 
             anova(fit); summary(fit); coefficients(fit); confint(fit)
or
             library(nlme)
             fit <- lme(yield ~ irrigation * variety, random=~1|field, irrigation)
             summary(fit); anova(fit)

PROJETO NESTADO: ( código aqui )

Structure:   DV continuous ~ FACTOR/-S with pseudoreplication.
Scenario:    [Glycogen] ~ Factors = Treatment & RANDOM EFFECTS with Russian-doll effect: 
             Six rats (6 Livers)-> 3 Microscopic Slides/Liver-> 2 Readings/Slide). 
Syntax:      fit <- aov(Glycogen ~ Treatment + Error(Rat/Liver), data); summary(fit)
Regression:  Mixed Effects
             require(lme4); require(lmerTest)
             fit <- lmer(Glycogen ~ Treatment + (1|Rat/Liver), rats); 
             anova(fit); summary(fit); coefficients(fit); confint(fit)
or
             require(nlme)
             fit<-lme(Glycogen ~ Treatment, random=~1|Rat/Liver, rats)
             summary(fit); anova(fit); VarCorr(fit)

SITES ÚTEIS:

  1. RExRepos
  2. Projeto Personalidade
  3. Quick-R
  4. R-Bloggers
  5. Análise aninhada e plotagem dividida por M. Crawley
  6. Modelos com vários efeitos aleatórios
  7. Modelos de plotagem dividida
  8. O Livro R de M. Crawley
  9. Dentro de grupos e medidas repetidas
  10. Repita as medidas em R
  11. GLMM FAQ
Antoni Parellada
fonte
Uma observação: para seus exemplos de ANOVA bidirecional (direto e fatorial), seu cenário / sintaxe é cyl + hp. Horespower é contínuo, então não funciona aqui. carb, o número de carburadores seria uma escolha melhor.
Gregor
Obrigado! Erro descuidado. Graças à sua nota, também detectei os cilindros tratados como contínuos, então mudei para as.factor. E incluí o TukeyHSD.
Antoni Parellada
1
Eu acho que você deve retirar 'Survival' do título, pois essa é uma área muito específica das estatísticas, completamente não relacionada ao que você está (muito bem) resumindo.
Bryan Hanson
Bom resumo Antoni! Talvez você também possa adicionar os glmmFAQs de Ben Bolker e talvez alguns exemplos simples de binômio e Poisson (GLM e GLMM). Mas entendo que isso pode complicar demais as coisas e tira esse resumo agradável e conciso. Como alternativa, você pode criar um link para exemplos neste site. Para uma simples completa Poisson / example binomial negativa isso pode funcionar: stats.stackexchange.com/questions/325334/...
Stefan

Respostas:

2

Boa lista, Antoni. Aqui estão algumas sugestões menores:

ANOVA unidirecional: IV é um fator com 3 ou mais níveis. Você também pode adicionar um exemplo de dados: mtcars a esta entrada. (Da mesma forma, você pode adicionar instruções * Dados de Exemplo "a todas as suas entradas, para esclarecer quais conjuntos de dados você está usando.)

Anova de duas vias: por que não usar IV1 e IV2 e afirmar que as duas variáveis ​​independentes devem ser fatores com pelo menos dois níveis cada? A maneira como você afirma isso atualmente sugere que uma anova bidirecional pode incluir mais de 2 variáveis ​​independentes (ou fatores), o que não é sensorial.

Para a Anova de duas vias, eu diferenciaria entre esses dois sub-casos: 1. Anova de duas vias com efeitos principais para IV1 e IV2 e 2. Anova de duas vias com uma interação entre IV1 e IV2. Este segundo item é o que você está chamando de dois como anova fatorial de duas vias.) Uma maneira melhor de descrever esses dois sub-casos seria: 1. O efeito de IV1 no DV é independente do efeito de IV2 e 2. Efeito de IV1 no DV depende do IV2. Você também pode deixar mais claro que são as variáveis ​​independentes IV1 e IV2 que são codificadas como dummy na configuração de regressão.

Para a ANCOVA, você pode esclarecer que está considerando apenas a ANCOVA unidirecional no seu exemplo atual. Para garantir a integridade, você pode adicionar um exemplo ANCOVA bidirecional sem interações entre IV1 e IV2 e outro com interação entre essas duas variáveis.

Para todas as opções acima, você também pode adicionar um item chamado Finalidade , que descreve quando essas análises são úteis. Por exemplo:

Objetivo (da anova de mão única): Investigue se os valores médios do VD são diferentes nos níveis do IV.

Para o MANOVA, você pode esclarecer que seria necessário (a) dois ou mais DVs e (2) um ou mais IVs, que são fatores? Eu acho que você pode diferenciar entre MANOVA unidirecional (com 1 fator) e MANOVA bidirecional? A mesma coisa para MANCOVA.

A ANOVA DENTRO DO FATOR também é conhecida como ANOVA DE MEDIDAS REPETIDAS; portanto, talvez você possa adicionar essa terminologia à sua lista para aqueles que a conhecem. Também seria útil esclarecer que a modelagem de efeitos mistos fornece uma maneira alternativa de modelar dados de medidas repetidas. Caso contrário, os leitores podem não apreciar a diferença entre as duas abordagens.

Isabella Ghement
fonte
É mais fácil para mim dar sugestões ao invés de fazer edits.🤗
Isabella Ghement