Estou trabalhando com um conjunto de dados com N em torno de 200.000. Nas regressões, estou vendo valores de significância muito pequenos << 0,001 associados a tamanhos de efeito muito pequenos, por exemplo, r = 0,028. O que eu gostaria de saber é: existe uma maneira baseada em princípios de decidir um limite de significância apropriado em relação ao tamanho da amostra? Existem outras considerações importantes sobre a interpretação do tamanho do efeito com uma amostra tão grande?
regression
probability
statistical-significance
sample-size
ted.strauss
fonte
fonte
Respostas:
Em A insignificância do teste de significância , Johnson (1999) observou que os valores de p são arbitrários, na medida em que você pode torná-los tão pequenos quanto desejar reunindo dados suficientes, assumindo que a hipótese nula é falsa, o que quase sempre é. No mundo real, é improvável que haja correlações semi-parciais que sejam exatamente zero, que é a hipótese nula no teste de significância de um coeficiente de regressão. Os pontos de corte do valor-p são ainda mais arbitrários. O valor de 0,05 como ponto de corte entre significância e não-significância é usado por convenção, não por princípio. Portanto, a resposta para sua primeira pergunta é não, não há uma maneira de decidir por um limite de significância apropriado.
Então, o que você pode fazer, considerando seu grande conjunto de dados? Depende do (s) motivo (s) para explorar a significância estatística de seus coeficientes de regressão. Você está tentando modelar um sistema multifatorial complexo e desenvolver uma teoria útil que se encaixe ou preveja razoavelmente a realidade? Talvez você possa pensar em desenvolver um modelo mais elaborado e adotar uma perspectiva de modelagem, como descrito em Rodgers (2010), A Epistemologia da Modelagem Matemática e Estatística . Uma vantagem de ter muitos dados é poder explorar modelos muito ricos, com vários níveis e interações interessantes (supondo que você tenha as variáveis para fazê-lo).
Se, por outro lado, você quiser julgar se deve tratar um coeficiente em particular como estatisticamente significativo ou não, convém considerar a sugestão de Good (1982) como resumida em Woolley (2003) : Calcular o valor q como que padroniza os valores p para um tamanho de amostra de 100. Um valor p de exatamente 0,001 converte-se em um valor p de 0,045 - ainda estatisticamente significativo.p⋅(n/100)−−−−−−√
Então, se é significativo usar um limite arbitrário ou outro, e daí? Se este é um estudo observacional, você tem muito mais trabalho para justificar que é realmente significativo da maneira que pensa e não apenas um relacionamento falso que aparece porque você especificou incorretamente o seu modelo. Observe que um efeito pequeno não é tão clinicamente interessante se representar diferenças pré-existentes entre as pessoas que selecionam níveis diferentes de tratamento, em vez de um efeito de tratamento.
Você precisa considerar se o relacionamento que está vendo é praticamente significativo, como observaram os comentaristas. Converter os números que você cita de para r 2 para a variação explicada ( r é correlação, quadrado para obter variação explicada) fornece apenas 3 e 6% de variação explicada, respectivamente, o que não parece muito.r r2 r
fonte
Eu acho que uma maneira fácil de verificar seria amostrar aleatoriamente um número igualmente grande do que você sabe que é uma distribuição duas vezes e comparar os dois resultados. Se você fizer isso várias vezes e observar valores-p semelhantes, isso sugere que não há efeito real. Se, por outro lado, você não tiver, então provavelmente existe.
fonte