Eu estava lendo esta pergunta sobre regressão em larga escala ( link ), onde whuber apontou um ponto interessante da seguinte maneira:
"Quase qualquer teste estatístico que você executa será tão poderoso que é quase certo identificar um efeito" significativo ". Você precisa se concentrar muito mais na importância estatística, como tamanho do efeito, e não na significância".
--- whuber
Eu queria saber se isso é algo que pode ser provado ou simplesmente alguns fenômenos comuns na prática?
Qualquer ponteiro para uma prova / discussão / simulação seria realmente útil.
regression
statistical-significance
Bayesric
fonte
fonte
Respostas:
É bem geral.
Imagine que há um efeito pequeno, mas diferente de zero (ou seja, algum desvio do nulo que o teste é capaz de captar).
Em amostras pequenas, a chance de rejeição será muito próxima da taxa de erro do tipo I (o ruído domina o pequeno efeito).
À medida que o tamanho da amostra cresce, o efeito estimado deve convergir para esse efeito populacional, enquanto ao mesmo tempo a incerteza do efeito estimado diminui (normalmente como ), até que a chance de que a situação nula esteja próxima o suficiente do efeito estimado de que ainda seja plausível em uma amostra selecionada aleatoriamente da população, reduz-se a zero efetivamente.n−−√
Ou seja, com nulos de ponto, eventualmente a rejeição se torna certa, porque em quase todas as situações reais, sempre haverá essencialmente algum desvio do nulo.
fonte
Isso não é uma prova, mas não é difícil mostrar a influência do tamanho da amostra na prática. Gostaria de usar um exemplo simples de Wilcox (2009) com pequenas alterações:
Podemos usar o teste t para esta análise:
Wilcox, RR, 2009. Estatísticas Básicas: Compreendendo Métodos Convencionais e Insights Modernos . Oxford University Press, Oxford.
fonte
Em regressão, para o modelo geral, o teste está em F. Aqui
fonte