Como exibir graficamente o erro tipo II (beta), a potência e o tamanho da amostra?

Me pedem para escrever uma introdução à estatística e estou lutando para mostrar graficamente a maneira como o valor-p e o poder se relacionam. Eu vim com este gráfico:

Duas curvas de Gauss interagindo

Minha pergunta: existe uma maneira melhor de exibir isso?

Aqui está o meu código R

x <- seq(-4, 4, length=1000)
hx <- dnorm(x, mean=0, sd=1)

plot(x, hx, type="n", xlim=c(-4, 8), ylim=c(0, 0.5), 
ylab = "",
xlab = "",
main= expression(paste("Type II (", beta, ") error")), axes=FALSE)
axis(1, at = c(-qnorm(.025), 0, -4), 
     labels = expression("p-value", 0, -infinity ))

shift = qnorm(1-0.025, mean=0, sd=1)*1.7
xfit2 <- x + shift
yfit2 <- dnorm(xfit2, mean=shift, sd=1)

# Print null hypothesis area
col_null = "#DDDDDD"
polygon(c(min(x), x,max(x)), c(0,hx,0), col=col_null)
lines(x, hx, lwd=2)

# The alternative hypothesis area

## The red - underpowered area
lb <- min(xfit2)
ub <- round(qnorm(.975),2)
col1 = "#CC2222"

i <- xfit2 >= lb & xfit2 <= ub
polygon(c(lb,xfit2[i],ub), c(0,yfit2[i],0), col=col1)

## The green area where the power is
col2 = "#22CC22"
i <- xfit2 >= ub
polygon(c(ub,xfit2[i],max(xfit2)), c(0,yfit2[i],0), col=col2)

# Outline the alternative hypothesis
lines(xfit2, yfit2, lwd=2)

axis(1, at = (c(ub, max(xfit2))), labels=c("", expression(infinity)), 
    col=col2, lwd=1, lwd.tick=FALSE)


legend("topright", inset=.05, title="Color",
   c("Null hypoteses","Type II error", "True"), fill=c(col_null, col1, col2), horiz=FALSE)

abline(v=ub, lwd=2, col="#000088", lty="dashed")

arrows(ub, 0.45, ub+1, 0.45, lwd=3, col="#008800")
arrows(ub, 0.45, ub-1, 0.45, lwd=3, col="#880000")

Atualizar

Obrigado pelas ótimas respostas. Eu mudei alguns dos códigos:

# Print null hypothesis area
col_null = "#AAAAAA"
polygon(c(min(x), x,max(x)), c(0,hx,0), col=col_null, lwd=2, density=c(10, 40), angle=-45, border=0)
lines(x, hx, lwd=2, lty="dashed", col=col_null)

...
legend("topright", inset=.015, title="Color",
   c("Null hypoteses","Type II error", "True"), fill=c(col_null, col1, col2), 
       angle=-45,
       density=c(20, 1000, 1000), horiz=FALSE)

Gosto da imagem frustrada e levemente vaga da hipótese nula, porque indica que ela não está realmente lá. Pensei na transparência e na adição do alfa, mas me preocupo em colocar muitas informações em uma imagem e, portanto, decidi não fazê-lo.

insira a descrição da imagem aqui

As limitações dos artigos impressos não permitem que eu experimente os leitores. Eu escolhi a resposta do @Greg Snow com o TeachingDemos como minha resposta, já que adoro a idéia com os dois erros que não se sobrepõem.

r teaching power Max Gordon
fonte

Você pode aprimorar um pouco o gráfico usando pseudo-transparência. Algo como nesta resposta .

Caracal

@caracal (+1) Deveria adicionar um padrão arrojado (como você) para a área que mostra potência.

chl

Isso é legal, já vi tramas semelhantes em outros lugares. Mas isso não mostra os valores reais de vários valores de p e a potência desses valores de p. Você pode calcular a potência para diferentes valores de p e tamanhos de amostra e, em seguida, colocar várias linhas em um gráfico

Peter Flom - Reintegrar Monica

Talvez verificar como os tipos de plotagens geradas pelo software G * Power 3 sejam boas para idéias sobre o que plotar. Embora de memória eles pareçam muito semelhantes ao que chl e caracal já apresentaram (e não ajudariam em como fazer isso em R).

21811 Andy W no dia

@Andy G * Poder inspirado em energia vs. gráficos de tamanho de efeito ou gráficos de poder vs. alfa seria uma boa adição. Para o primeiro caso, um começo pode ser essa resposta , que deve ser facilmente adaptável ao segundo caso.

caracal

Respostas:

Eu brinquei com gráficos similares e descobri que ele funciona melhor quando as duas curvas não se bloqueiam, mas são deslocadas verticalmente (mas ainda no mesmo eixo x). Isso deixa claro que uma das curvas representa a hipótese nula e a outra representa um determinado valor para a média na hipótese alternativa. A power.exampfunção no pacote TeachingDemos para R criará esses gráficos e a run.power.exampfunção (mesmo pacote) permite alterar interativamente os argumentos e atualizar o gráfico.

Greg Snow
fonte

+1, uma ilustração mais completa que a minha. (Na verdade, eu sabia que havia algo no TeachingDemospacote, mas estava com preguiça de procurá-lo.)

chl

Algumas reflexões: (a) use transparência e (b) permita alguma interatividade.

Aqui está minha opinião, em grande parte inspirada por um applet Java sobre erros do tipo I e tipo II - cometendo erros no sistema de justiça . Como esse é um código de desenho bastante puro, colei como essência # 1139310 .

Aqui está como fica:

insira a descrição da imagem aqui

Depende do aplpack $H_0$

chl
fonte

Isso é realmente incrível, eu nunca tinha visto um pacote antes.

Ken Williams

@ Ken Obrigado. O aplpackpacote também possui alguns bons complementos para viz de dados. No entanto, o rpanel , que também depende de tcl / tk, é provavelmente uma opção melhor para coisas mais complexas. Agora, com rstudio ea manipular pacote, é também fácil de aumentar a trama básica em R.

chl

O G Power 3 , software livre disponível para Mac e Windows, possui alguns recursos gráficos excelentes para análise de energia. O gráfico principal é amplamente consistente com o gráfico e com o mostrado por @chl. Ele usa uma linha reta simples para indicar hipóteses nulas e distribuições estatísticas de testes de hipóteses alternativas e cores em beta e alfa em cores separadas.

Um recurso interessante do G Power 3 é que ele suporta um grande número de cenários comuns de análise de energia e a GUI facilita a exploração de estudantes e pesquisadores aplicados.

Aqui está uma captura de tela de um slide (tirado de uma apresentação que fiz sobre estatística descritiva com uma seção sobre análise de potência ) com vários desses gráficos mostrados à esquerda. Se você escolher uma versão de teste t de uma cauda, ela se parecerá mais com o seu exemplo.

g power 3 gráficos

Também é possível produzir gráficos que mostram a relação funcional entre os fatores relevantes para o poder estatístico e o teste de hipóteses (por exemplo, alfa, tamanho do efeito, tamanho da amostra, poder, etc.). Apresento alguns exemplos de tais gráficos aqui . Aqui está um exemplo desse gráfico:

insira a descrição da imagem aqui

Jeromy Anglim
fonte

Pacote interessante, analisarei isso no futuro. Os gráficos parecem um pouco complicados para alguém novo em campo. Meu público é médico sem qualquer conhecimento de fundo matemático ou estatístico. Obrigado!

Max Gordon