Me pedem para escrever uma introdução à estatística e estou lutando para mostrar graficamente a maneira como o valor-p e o poder se relacionam. Eu vim com este gráfico:
Minha pergunta: existe uma maneira melhor de exibir isso?
Aqui está o meu código R
x <- seq(-4, 4, length=1000)
hx <- dnorm(x, mean=0, sd=1)
plot(x, hx, type="n", xlim=c(-4, 8), ylim=c(0, 0.5),
ylab = "",
xlab = "",
main= expression(paste("Type II (", beta, ") error")), axes=FALSE)
axis(1, at = c(-qnorm(.025), 0, -4),
labels = expression("p-value", 0, -infinity ))
shift = qnorm(1-0.025, mean=0, sd=1)*1.7
xfit2 <- x + shift
yfit2 <- dnorm(xfit2, mean=shift, sd=1)
# Print null hypothesis area
col_null = "#DDDDDD"
polygon(c(min(x), x,max(x)), c(0,hx,0), col=col_null)
lines(x, hx, lwd=2)
# The alternative hypothesis area
## The red - underpowered area
lb <- min(xfit2)
ub <- round(qnorm(.975),2)
col1 = "#CC2222"
i <- xfit2 >= lb & xfit2 <= ub
polygon(c(lb,xfit2[i],ub), c(0,yfit2[i],0), col=col1)
## The green area where the power is
col2 = "#22CC22"
i <- xfit2 >= ub
polygon(c(ub,xfit2[i],max(xfit2)), c(0,yfit2[i],0), col=col2)
# Outline the alternative hypothesis
lines(xfit2, yfit2, lwd=2)
axis(1, at = (c(ub, max(xfit2))), labels=c("", expression(infinity)),
col=col2, lwd=1, lwd.tick=FALSE)
legend("topright", inset=.05, title="Color",
c("Null hypoteses","Type II error", "True"), fill=c(col_null, col1, col2), horiz=FALSE)
abline(v=ub, lwd=2, col="#000088", lty="dashed")
arrows(ub, 0.45, ub+1, 0.45, lwd=3, col="#008800")
arrows(ub, 0.45, ub-1, 0.45, lwd=3, col="#880000")
Atualizar
Obrigado pelas ótimas respostas. Eu mudei alguns dos códigos:
# Print null hypothesis area
col_null = "#AAAAAA"
polygon(c(min(x), x,max(x)), c(0,hx,0), col=col_null, lwd=2, density=c(10, 40), angle=-45, border=0)
lines(x, hx, lwd=2, lty="dashed", col=col_null)
...
legend("topright", inset=.015, title="Color",
c("Null hypoteses","Type II error", "True"), fill=c(col_null, col1, col2),
angle=-45,
density=c(20, 1000, 1000), horiz=FALSE)
Gosto da imagem frustrada e levemente vaga da hipótese nula, porque indica que ela não está realmente lá. Pensei na transparência e na adição do alfa, mas me preocupo em colocar muitas informações em uma imagem e, portanto, decidi não fazê-lo.
As limitações dos artigos impressos não permitem que eu experimente os leitores. Eu escolhi a resposta do @Greg Snow com o TeachingDemos como minha resposta, já que adoro a idéia com os dois erros que não se sobrepõem.
Respostas:
Eu brinquei com gráficos similares e descobri que ele funciona melhor quando as duas curvas não se bloqueiam, mas são deslocadas verticalmente (mas ainda no mesmo eixo x). Isso deixa claro que uma das curvas representa a hipótese nula e a outra representa um determinado valor para a média na hipótese alternativa. A
power.examp
função no pacote TeachingDemos para R criará esses gráficos e arun.power.examp
função (mesmo pacote) permite alterar interativamente os argumentos e atualizar o gráfico.fonte
TeachingDemos
pacote, mas estava com preguiça de procurá-lo.)Algumas reflexões: (a) use transparência e (b) permita alguma interatividade.
Aqui está minha opinião, em grande parte inspirada por um applet Java sobre erros do tipo I e tipo II - cometendo erros no sistema de justiça . Como esse é um código de desenho bastante puro, colei como essência # 1139310 .
Aqui está como fica:
Depende do aplpackH0 0
fonte
aplpack
pacote também possui alguns bons complementos para viz de dados. No entanto, o rpanel , que também depende de tcl / tk, é provavelmente uma opção melhor para coisas mais complexas. Agora, com rstudio ea manipular pacote, é também fácil de aumentar a trama básica em R.O G Power 3 , software livre disponível para Mac e Windows, possui alguns recursos gráficos excelentes para análise de energia. O gráfico principal é amplamente consistente com o gráfico e com o mostrado por @chl. Ele usa uma linha reta simples para indicar hipóteses nulas e distribuições estatísticas de testes de hipóteses alternativas e cores em beta e alfa em cores separadas.
Um recurso interessante do G Power 3 é que ele suporta um grande número de cenários comuns de análise de energia e a GUI facilita a exploração de estudantes e pesquisadores aplicados.
Aqui está uma captura de tela de um slide (tirado de uma apresentação que fiz sobre estatística descritiva com uma seção sobre análise de potência ) com vários desses gráficos mostrados à esquerda. Se você escolher uma versão de teste t de uma cauda, ela se parecerá mais com o seu exemplo.
Também é possível produzir gráficos que mostram a relação funcional entre os fatores relevantes para o poder estatístico e o teste de hipóteses (por exemplo, alfa, tamanho do efeito, tamanho da amostra, poder, etc.). Apresento alguns exemplos de tais gráficos aqui . Aqui está um exemplo desse gráfico:
fonte