Como desenhar um gráfico de interação com intervalos de confiança?

11

Minhas tentativas:

  1. Não consegui intervalos de confiança em interaction.plot()

  2. e por outro lado plotmeans()do pacote 'gplot' não exibia dois gráficos. Além disso, eu não poderia impor dois plotmeans()gráficos um em cima do outro porque, por padrão, o eixo é diferente.

  3. Eu tive algum sucesso usando o plotCI()pacote 'gplot' e sobrepondo dois gráficos, mas ainda assim a correspondência do eixo não era perfeita.

Algum conselho sobre como fazer um gráfico de interação com intervalos de confiança? Por uma função, ou conselhos sobre como sobrepor plotmeans()ou plotCI()gráficos.

amostra de código

br=structure(list(tangle = c(140L, 50L, 40L, 140L, 90L, 70L, 110L, 
150L, 150L, 110L, 110L, 50L, 90L, 140L, 110L, 50L, 60L, 40L, 
40L, 130L, 120L, 140L, 70L, 50L, 140L, 120L, 130L, 50L, 40L, 
80L, 140L, 100L, 60L, 70L, 50L, 60L, 60L, 130L, 40L, 130L, 100L, 
70L, 110L, 80L, 120L, 110L, 40L, 100L, 40L, 60L, 120L, 120L, 
70L, 80L, 130L, 60L, 100L, 100L, 60L, 70L, 90L, 100L, 140L, 70L, 
100L, 90L, 130L, 70L, 130L, 40L, 80L, 130L, 150L, 110L, 120L, 
140L, 90L, 60L, 90L, 80L, 120L, 150L, 90L, 150L, 50L, 50L, 100L, 
150L, 80L, 90L, 110L, 150L, 150L, 120L, 80L, 80L), gtangles = c(141L, 
58L, 44L, 154L, 120L, 90L, 128L, 147L, 147L, 120L, 127L, 66L, 
118L, 141L, 111L, 59L, 72L, 45L, 52L, 144L, 139L, 143L, 73L,  
59L, 148L, 141L, 135L, 63L, 51L, 88L, 147L, 110L, 68L, 78L, 63L, 
64L, 70L, 133L, 49L, 129L, 100L, 78L, 128L, 91L, 121L, 109L, 
48L, 113L, 50L, 68L, 135L, 120L, 85L, 97L, 136L, 59L, 112L, 103L, 
62L, 87L, 92L, 116L, 141L, 70L, 121L, 92L, 137L, 85L, 117L, 51L, 
84L, 128L, 162L, 102L, 127L, 151L, 115L, 57L, 93L, 92L, 117L, 
140L, 95L, 159L, 57L, 65L, 130L, 152L, 90L, 117L, 116L, 147L, 
140L, 116L, 98L, 95L), up = c(-1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 
-1L, -1L, 1L, 1L, 1L, 1L, -1L, -1L, -1L, -1L, 1L, 1L, -1L, -1L, 
1L, 1L, -1L, 1L, 1L, -1L, 1L, 1L, 1L, 1L, 1L, -1L, -1L, 1L, 1L, 
1L, 1L, -1L, -1L, 1L, 1L, -1L, -1L, -1L, -1L, -1L, -1L, -1L, 
1L, -1L, -1L, -1L, -1L, -1L, 1L, -1L, 1L, 1L, -1L, -1L, -1L, 
-1L, 1L, -1L, 1L, -1L, -1L, -1L, 1L, -1L, 1L, -1L, 1L, 1L, 1L, 
-1L, -1L, -1L, -1L, -1L, -1L, 1L, -1L, 1L, 1L, -1L, -1L, 1L, 
1L, 1L, -1L, 1L, 1L, 1L)), .Names = c("tangle", "gtangles", "up"
), class = "data.frame", row.names = c(NA, -96L))

plotmeans2 <- function(br, alph) {
dt=br;   tmp   <- split(br$gtangles, br$tangle);   
means <- sapply(tmp, mean);  stdev <- sqrt(sapply(tmp, var));  
n <- sapply(tmp,length);  
ciw   <- qt(alph, n) * stdev / sqrt(n)
plotCI(x=means, uiw=ciw, col="black", barcol="blue", lwd=1,ylim=c(40,150),  xlim=c(1,12)); 
par(new=TRUE) dt= subset(br,up==1);   
tmp   <- split(dt$gtangles, dt$tangle);  
means <- sapply(tmp, mean);  
stdev <- sqrt(sapply(tmp, var));  
n <- sapply(tmp,length); 
ciw  <- qt(0.95, n) * stdev / sqrt(n)
plotCI(x=means, uiw=ciw, type='l',col="black", barcol="red", lwd=1,ylim=c(40,150), xlim=c(1,12),pch='+');
abline(v=6);abline(h=90);abline(30,10); par(new=TRUE);
dt=subset(br,up==-1);   
tmp <- split(dt$gtangles, dt$tangle);  
means <- sapply(tmp, mean);  
stdev <- sqrt(sapply(tmp, var));  
n <- sapply(tmp,length); 
ciw <- qt(0.95, n) * stdev / sqrt(n)
plotCI(x=means, uiw=ciw, type='l', col="black", barcol="blue",   lwd=1,ylim=c(40,150), xlim=c(1,12),pch='-');abline(v=6);abline(h=90);
abline(30,10);
}

plotmeans2(br,.95)
Adam SA
fonte

Respostas:

21

Se você estiver disposto a usar o ggplot , tente o seguinte código.

Com um preditor contínuo

library(ggplot2)
gp <- ggplot(data=br, aes(x=tangle, y=gtangles)) 
gp + geom_point() + stat_smooth(method="lm", fullrange=T) + facet_grid(. ~ up)

para um gráfico de interação facetado

insira a descrição da imagem aqui

Para um gráfico de interação padrão (como o produzido por interaction.plot()), basta remover a faceta.

gp <- ggplot(data=br, aes(x=tangle, y=gtangles, colour=factor(up))) 
gp + geom_point() + stat_smooth(method="lm")

insira a descrição da imagem aqui

Com um preditor discreto

Usando o ToothGrowthconjunto de dados (consulte help(ToothGrowth)),

ToothGrowth$dose.cat <- factor(ToothGrowth$dose, labels=paste("d", 1:3, sep=""))
df <- with(ToothGrowth , aggregate(len, list(supp=supp, dose=dose.cat), mean))
df$se <- with(ToothGrowth , aggregate(len, list(supp=supp, dose=dose.cat), 
              function(x) sd(x)/sqrt(10)))[,3]

opar <- theme_update(panel.grid.major = theme_blank(),
                     panel.grid.minor = theme_blank(),
                     panel.background = theme_rect(colour = "black"))
gp <- ggplot(df, aes(x=dose, y=x, colour=supp, group=supp))
gp + geom_line(aes(linetype=supp), size=.6) + 
     geom_point(aes(shape=supp), size=3) + 
     geom_errorbar(aes(ymax=x+se, ymin=x-se), width=.1)
theme_set(opar)

insira a descrição da imagem aqui

chl
fonte
Muito obrigado pela resposta detalhada. Eu queria perguntar, existe uma maneira de fazer intervalos de confiança verticais em cada nível da variável independente? Existe uma maneira de remover o plano de fundo e reverter para o gráfico 'antigo'?
Adam SA
1
@ Adam Atualizei minha resposta com o caso de 2 variáveis ​​categóricas + uma variável de resposta contínua - espero que seja isso que você quis dizer. Também adicionei código para mostrar como personalizar o ggplottema. Geralmente, você pode dizer gp + theme_bw()para remover apenas o fundo cinza; aqui, eu também removi a grade.
chl
12

Há também o pacote de efeitos de Fox e Hong em R. Veja o J. Stat. Suave. documentos aqui e aqui para exemplos com intervalos de confiança e geração de código R.

Não é tão bonito quanto uma solução ggplot, mas um pouco mais geral e um salva-vidas para GLMs moderadamente complexos.

conjugado
fonte
1
(+1) Devo admitir que prefiro esta abordagem :-)
chl
@chl e / ou Conjugado, você pode dizer mais sobre por que prefere essa abordagem? Ele iria ajudar pessoas como eu decidir qual método de investir tempo em.
Michael Bishop
1
@MichaelBishop Essencialmente porque envolve muitas coisas complicadas (plotagem na escala de link versus resposta, exibindo IC de 95% para GLMMM, marginalização contra termos de interação etc.) que seriam difíceis de manipular em alguns comandos R (e pessoalmente, Eu gosto muito de latticegráficos :)
chl