Quais estatísticas descritivas não são tamanhos de efeito?

12

Wikipedia diz

o tamanho do efeito é uma medida da força de um fenômeno ou de uma estimativa amostral dessa quantidade. Um tamanho de efeito calculado a partir dos dados é uma estatística descritiva que transmite a magnitude estimada de um relacionamento sem fazer nenhuma afirmação sobre se o aparente relacionamento nos dados reflete um verdadeiro relacionamento na população.

Para entender melhor, eu queria saber quais estatísticas descritivas não são o tamanho do efeito, exceto gráficos e gráficos.

Tim
fonte
Na verdade, gráficos e plotagens podem ser ótimos para medir o tamanho de um efeito de maneiras mais intuitivas do que as medidas de tamanho de efeito. Se você realmente observar a sobreposição entre dois grupos em algumas medidas (o que corresponderia aproximadamente a um d menor ), talvez seja mais fácil perceber que uma diferença significativa não significa que um membro de um grupo tenha pontuações mais baixas do que os membros do outro grupo. , etc.
Gala

Respostas:

18

Tamanhos de efeito

  • Os tamanhos de efeito padronizados comuns geralmente quantificam a quantidade ou o grau de um relacionamento ou efeito. As medidas de tamanho de efeito mais comuns são provavelmente d de cohen, r de Pearson e o odds ratio (particularmente para um preditor binário).
  • Medidas de tamanho de efeito menos comuns:Dito isto, você pode ter medidas de tamanho de efeito padronizadas e não padronizadas. Qualquer estatística que comunique o grau de relacionamento e não seja especialmente contaminada pelo tamanho da amostra é provavelmente uma medida do tamanho do efeito. Assim, coeficientes beta, quadrado R, covariância, diferenças médias brutas entre grupos e assim por diante capturam o grau de efeito. Dito isso, acho que alguns pesquisadores aplicam medidas de tamanho de efeito de maneira um tanto cega e esquecem que o objetivo mais amplo é dar aos leitores uma noção do grau de efeito. E assim, muitas vezes eles não percebem que medidas como diferenças médias ou coeficientes de regressão brutos são, em certo sentido, uma medida de tamanho de efeito. Outro exemplo de uso cego de tamanhos de efeito envolve o uso de medidas de tamanho de efeito que não possuem uma interpretação intuitiva, mas foram recomendadas por alguns manuais.

Não tamanhos de efeito:

  • A maioria das estatísticas de teste não tem tamanho de efeito. Por exemplo, teste do qui-quadrado, teste t, teste z, teste F. Eles aumentam à medida que o tamanho do efeito da população aumenta e à medida que o tamanho da amostra aumenta. Em muitos aspectos, toda a linguagem dos tamanhos de efeito foi enfatizada nos últimos anos porque os pesquisadores estavam focando demais em quão grandes eram as estatísticas dos seus testes, e não em quão grandes eram os tamanhos dos seus efeitos. Isso é especialmente importante quando você tem um tamanho de amostra grande quando mesmo pequenos efeitos podem ser estatisticamente significativos.
  • A maioria das estatísticas univariadas não são tamanhos de efeito. Para a maioria dos propósitos, o tamanho do efeito está preocupado com o relacionamento entre pelo menos duas variáveis. Assim, a média da amostra, desvio padrão, inclinação, curtose, min, max e assim por diante não são medidas de tamanho de efeito.
  • As estatísticas que não pertencem ao grau de relacionamento não são medidas de tamanho de efeito. Por exemplo, testes de normalidade multivariada, os autovalores de uma matriz e assim por diante geralmente não visam diretamente quantificar um efeito no sentido comum da palavra.

Considerações mais amplas

  • Considerações sobre dimensionamento: A utilidade de uma estatística como uma medida de tamanho de efeito está amplamente relacionada à sua capacidade de comunicar o tamanho de um efeito. Às vezes, isso é alcançado usando medidas padronizadas de efeito conhecidas (por exemplo, d de Cohen). Outras vezes, uma consideração cuidadosa do dimensionamento das variáveis ​​pode produzir uma interpretação ainda mais clara do tamanho do efeito. Por exemplo, digamos que eu tenha estudado um programa de treinamento sobre níveis de renda. Eu poderia relatar que o programa de treinamento aumentou a renda em 0,2 desvios padrão ou poderia dizer que o programa aumentou a renda em US $ 3.500. Ambos são úteis; ambos são medidas de tamanho de efeito. O primeiro é padronizado (d de Cohen), o segundo não é padronizado (diferenças médias do grupo bruto).
  • Precisão na estimativa do tamanho do efeito: Geralmente, extraímos amostras de estimativas de medidas do tamanho do efeito (por exemplo, d de cohen, r de pearson, etc.). Esse contexto pode levar a um teste de significância contrastante com medidas de tamanho de efeito. No entanto, o objetivo ainda deve ser estimar de forma precisa e imparcial o tamanho do efeito da população. De uma perspectiva freqüentista, os intervalos de confiança em torno dos tamanhos dos efeitos fornecem uma estimativa de precisão. De uma perspectiva bayesiana, existem densidades posteriores nos tamanhos dos efeitos. Em muitos casos, é necessário tomar cuidado para garantir que você esteja usando uma medida de tamanho de efeito imparcial.
Jeromy Anglim
fonte
1
(+1) Boa resposta.
chl 16/05
O terceiro e o último ponto provavelmente explicam de onde vêm os autores do artigo da Wikipedia. Dada a ênfase na psicologia, acho que o objetivo não é tanto contrastar o tamanho do efeito com outras estatísticas descritivas, mas sim estatísticas de teste e valores-p (isto é, estatísticas inferenciais) e enfatizar que as medidas do tamanho do efeito não dizem nada sobre a variabilidade da amostra.
Gala
Muito obrigado pela sua boa resposta. Porém, eu tenho uma pergunta: o intervalo de confiança não pode ser usado como uma medida de tamanho de efeito, porque está diretamente relacionado ao tamanho da amostra? (por intervalo de confiança, quero dizer o valor que é adicionado ou subtraído da prevalência, média etc. - e não dos limites superior e inferior de um IC).
Vic
2
@ Vic, você pode ter um intervalo de confiança em uma medida de tamanho de efeito, mas o intervalo de confiança em si não é o tamanho do efeito.
Jeromy Anglim
Muito obrigado querido Jeromy. Por todos esses anos eu estava enganado. :)
Vic
6

Primeiro, os tamanhos dos efeitos podem ser usados ​​de forma inferencial e descritiva. r e ORs são todos tamanhos de efeito e certamente são usados ​​em estatísticas inferenciais.

As estatísticas univariadas geralmente não são tamanhos de efeito, embora possam ser. Por exemplo, se você estiver comparando idades de homens e mulheres casados, a idade média dos homens não é um tamanho de efeito (a diferença de médias seria um tamanho de efeito). Mas se você quiser ver se a média de algo é 0, a média seria um tamanho de efeito.

Se ele mede um efeito, é um tamanho de efeito!

Peter Flom - Restabelece Monica
fonte
Eu acho que isso é verdade @ Peter, mas o tamanho do efeito é um termo que foi definido de maneira mais restrita por Cohen: (Mean1-Mean2) / PooledSD. Parece um pouco a diferença significativa ou apenas estatisticamente significativa - o uso de palavras comuns para definir um termo estatístico.
Doug.numbers
2
Onde Cohen define dessa maneira? Se você quer dizer o livro dele sobre Análise de Potência, acho que ele usa isso como o tipo de padrão para converter outros tamanhos de efeito. Mas cada mesa análise de poder nesse livro (e há um monte) usa algum tamanho do efeito (e não todo o uso que um)
Peter Flom - Reintegrar Monica
1
O d de Cohen é sempre o que eu entendi. Semelhante ao descrito em en.wikipedia.org/wiki/Effect_size . Mas você está absolutamente certo, existem muitos métodos descritos como tamanho do efeito.
Doug.numbers
4
O teste t e o teste z não são tamanhos de efeito. o mesmo tamanho de efeito produzirá valores tez substancialmente diferentes para diferentes tamanhos de amostra.
Jeromy Anglim
1
@JeromyAnglim está certo; +1. Eu editei minha resposta
Peter Flom - Reinstate Monica