Para uma análise de tamanho de efeito, estou percebendo que existem diferenças entre o d de Cohen, o g de Hedges e o g * de Hedges.
- Essas três métricas são normalmente muito semelhantes?
- O que seria um caso em que produziriam resultados diferentes?
- Também é uma questão de preferência que eu uso ou relato?
effect-size
cohens-d
Elpezmuerto
fonte
fonte
Respostas:
O co de g de Cohen e o de hedges variam de acordo com a suposição de variações populacionais iguais, mas o de g usa n - 1 para cada amostra em vez de n, o que fornece uma estimativa melhor, especialmente quanto menor o tamanho da amostra. Tanto d e g têm um certo viés positivo, mas apenas de forma insignificante para tamanhos de amostra moderados ou maiores. O viés é reduzido usando g *. O d de Glass não assume variâncias iguais; portanto, usa o sd de um grupo de controle ou grupo de comparação de linha de base como padronizador para a diferença entre as duas médias.
Esses tamanhos de efeito e os tamanhos de efeito não paramétrico de Cliff e outros são discutidos em detalhes em meu livro:
Grissom, RJ, & Kim, J, J. (2005). Tamanhos de efeito para pesquisa: Uma ampla abordagem prática. Mahwah, NJ: Erlbaum.
fonte
Na minha opinião, o g de Hedges é uma versão um pouco mais precisa do d de Cohen (com SD agrupado), na medida em que adicionamos um fator de correção para amostras pequenas. Ambas as medidas geralmente concordam quando a suposição de homoscedasticidade não é violada, mas podemos encontrar situações em que esse não é o caso, ver, por exemplo, McGrath & Meyer, Psychological Methods 2006, 11 (4) : 386-401 ( pdf ). Outros papéis estão listados no final da minha resposta.
Geralmente descobri que em quase todos os estudos psicológicos ou biomédicos, esse é o d de Cohen que é relatado; isso provavelmente se destaca da conhecida regra de ouro por interpretar sua magnitude (Cohen, 1988). Não conheço nenhum artigo recente considerando o g de Hedges (ou o delta de Cliff como uma alternativa não paramétrica). Bruce Thompson tem uma versão revisada da seção APA sobre o tamanho do efeito.
Pesquisando sobre os estudos de Monte Carlo em torno das medidas de tamanho de efeito, achei este artigo interessante (só li o resumo e a simulação): Intervalos de confiança robustos para tamanhos de efeito: um estudo comparativo dos delta de Cohen e Cliff sob não-normalidade e variações heterogêneas (pdf).
Sobre o seu segundo comentário, o
MBESS
pacote R inclui vários utilitários para o cálculo do ES (por exemplo,smd
e funções relacionadas).Outras referências
fonte
Parece que quando as pessoas dizem que d de Cohen elas querem dizer principalmente:
Ondes é o desvio padrão combinado,
Existem outros estimadores para o desvio padrão combinado, provavelmente o mais comum, além do acima mencionado:
Outras vezes, o g de Hedge é reservado para se referir a qualquer uma das versões corrigidas de viés de uma diferença média padronizada desenvolvida por Hedges. Hedges (1981) mostrou que o d de Cohen era enviesado para cima (ou seja, seu valor esperado é superior ao valor real do parâmetro populacional), especialmente em pequenas amostras, e propôs um fator de correção para corrigir o viés de d de Cohen:
G de Hedges (o estimador imparcial):
No entanto, esse fator de correção é razoavelmente complexo em termos computacionais; portanto, Hedges também forneceu uma aproximação computacionalmente trivial que, embora ainda um pouco tendenciosa, é adequada para quase todos os objetivos possíveis:
(Originalmente de Hedges, 1981, esta versão de Borenstein, Hedges, Higgins & Rothstein, 2011, p. 27)
References:
Borenstein, M., Hedges, L. V., Higgins, J. P., & Rothstein, H. R. (2011). Introduction to Meta-Analysis. West Sussex, United Kingdom: John Wiley & Sons.
Cohen, J. (1977). Statistical power analysis for the behavioral sciences (2nd ed.). Hillsdale, NJ, US: Lawrence Erlbaum Associates, Inc.
Hedges, L. V. (1981). Distribution Theory for Glass's Estimator of Effect size and Related Estimators. Journal of Educational Statistics, 6(2), 107-128. doi:10.3102/10769986006002107
Hedges L. V., Olkin I. (1985). Statistical methods for meta-analysis. San Diego, CA: Academic Press
fonte
If you're just trying to understand the basic meaning of Hedges' g, as I am, you might also find this helpful:
Their definition is short and clear:
I would appreciate statistics experts editing this to add any important caveats to the small (0.2) medium (0.5) and large (0.8) claim, to help nonexperts avoid misinterpreting Hedges' g numbers used in social science and psychology research.
[1] http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2848393/ The Effect of Mindfulness-Based Therapy on Anxiety and Depression: A Meta-Analytic Review Stefan G. Hofmann, Alice T. Sawyer, Ashley A. Witt, and Diana Oh. J Consult Clin Psychol. 2010 April; 78(2): 169–183. doi: 10.1037/a0018555
[2] Cohen J. Statistical power analysis for the behavioral sciences. 2nd ed. Erlbaum; Hillsdale, NJ: 1988 (cited in [1])
fonte
The other posters have covered the issue of similarities and differences between g and d. Just to add to this, some scholars do feel that the effect size values offered by Cohen are far too generous leading to overinterpretation of weak effects. They are also not tied to r leading to the possibility scholars may convert back and forth to obtain more favorably interpretable effect sizes. Ferguson (2009, Professional Psychology: Research and PRactice) suggested using the following values for interpretation for g:
.41, as the recommended minimum for "practical significance." 1.15, moderate effect 2.70, strong effect
These are obviously more rigorous/difficult to achieve and not many social science experiments are going to get to strong effects...which is probably how it should be.
fonte
Bruce Thompson did warn about using Cohen's (0.2) as small (0.5) as medium and (0.8) as large. Cohen never meant for these to be used as rigid interpretations. All effect sizes must be interpreted based on the context of the related literature. If you are analyzing the related effect sizes reported on your topic and they are (0.1) (0.3) (0.24) and you produce an effect of (0.4) then that may be "large". Conversely, if all the related literature has effects of (0.5) (0.6) (0.7) and you have the effect of (0.4) it may be considered small. I know this is a trivial example but imperatively important. I believe Thompson once stated in a paper, "We would merely be stupid in a different metric" when comparing interpretations of effect sizes to how social scientists were interpreting p values at the time.
fonte