A imagem abaixo é deste artigo na Psychological Science . Um colega apontou duas coisas incomuns a respeito:
- De acordo com a legenda, as barras de erro mostram "± 2,04 erros padrão, o intervalo de confiança de 95%". Eu só vi ± 1,96 SE usado para o IC de 95% e não consigo encontrar nada sobre o 2,04 SE sendo usado para qualquer finalidade. 2.04 SE tem algum significado aceito ?
- O texto afirma que as comparações planejadas aos pares encontraram diferenças significativas para a magnitude média do sobressalto no erro versus tentativas previsíveis corretas (t (30) = 2,51, p <0,01) e erro vs. tentativas imprevisíveis corretas (t (30) = 2,61, p <0,01) (o teste omnibus F também foi significativo em p <0,05). No entanto, o gráfico mostra as barras de erro para as três condições que se sobrepõem substancialmente. Se os intervalos de ± 2,04 SE se sobrepõem, como os valores podem ser significativamente diferentes em p <0,05? A sobreposição é grande o suficiente para que eu assuma que os intervalos de ± 1,96 SE também se sobrepõem.
Respostas:
fonte
F(2,60)=5.64, p<.05
) implica que se tratava de um teste de medidas repetidas e, portanto, os testes post hoc provavelmente também o eram.Parte da confusão aqui é a representação confusa dos dados. Parece ser um projeto de medidas repetidas, mas as barras de erro são intervalos de confiança de quão bem o valor médio verdadeiro foi estimado. Um objetivo principal de medidas repetidas é evitar a coleta de dados suficientes para obter uma estimativa de qualidade do valor médio bruto. Portanto, barras de erro como as apresentadas realmente não têm quase nenhuma relação com a história contada. O valor do interesse crítico é o efeito. Com o objetivo de os gráficos serem destacar o ponto principal da história, representar graficamente os efeitos e seus intervalos de confiança teria sido mais apropriado.
fonte