O teste t de Welch para variações desiguais (também conhecido como Welch-Satterthwaite ou Welch-Aspin) geralmente possui graus de liberdade não inteiros . Como esses graus de liberdade devem ser citados ao relatar os resultados do teste?
"É convencional arredondar para o número inteiro mais próximo antes de consultar as tabelas t padrão" de acordo com várias fontes * - o que faz sentido, pois essa direção de arredondamento é conservadora. ** Algum software estatístico mais antigo também faria isso (por exemplo, Graphpad Prism antes da versão 6 ) e algumas calculadoras online ainda o fazem. Se esse procedimento tivesse sido usado, relatar os graus de liberdade arredondados parece apropriado. (Embora o uso de um software melhor possa ser ainda mais apropriado!)
Mas a grande maioria dos pacotes modernos utiliza a parte fracionária, portanto, neste caso, parece que a parte fracionária deve ser citada. Não vejo como apropriado citar mais de duas casas decimais, pois um milésimo de grau de liberdade teria apenas um impacto insignificante no valor- p .
Olhando ao redor do Google Scholar, posso ver trabalhos citando o df como um número inteiro, com uma casa decimal ou duas casas decimais. Existem diretrizes sobre quanta precisão usar? Além disso, se o software utilizado na parte fraccionada completo, no caso do citado df ser arredondado para baixo para o número desejado de valores (por exemplo, para 1 ou dp como um número inteiro), desde que apropriado com o cálculo conservador, ou como me parece mais sensato, arredondado convencionalmente ( para o mais próximo ), de modo que a 1 dp ou ao todo mais próximo?
Editar: além de conhecer a maneira mais teoricamente correta de relatar df não inteiro, também seria bom saber o que as pessoas fazem na prática . Presumivelmente, os periódicos e os guias de estilo têm seus próprios requisitos. Gostaria de saber o que guias de estilo influentes como o APA exigem. Pelo que posso discernir (o manual deles não está disponível gratuitamente on-line), a APA tem uma preferência geral de que quase tudo deve aparecer com duas casas decimais, exceto os valores de p (que podem ser de dois ou três pontos) e as porcentagens (arredondadas para o porcentagem mais próxima) - que abrange inclinações de regressão, estatísticas t , estatísticas F , estatísticas e assim por diante. Isso é bastante ilógico, tendo em mente que a segunda casa decimal ocupa um número significativo muito diferente e sugere uma precisão bastante diferente, em 2,47 do que em 982,47, mas pode explicar o número de Welch df com duas casas decimais que vi na minha amostra não científica .
por exemplo, Ruxton, GD O teste t de variação desigual é uma alternativa subutilizada ao teste t de Student e ao teste U de Mann-Whitney , Ecologia comportamental (julho / agosto de 2006) 17 (4): 688-690 doi: 10.1093 / beheco / ark016
Embora a própria aproximação de Welch-Satterthwaite possa ou não ser conservadora, e em um caso em que não seja conservadora, arredondar os graus de liberdade não é garantia de compensação geral.
fonte
Respostas:
Como não estudei a prática real, essa resposta não pode abordar esse aspecto da questão. Como princípio geral, eu esperaria que o tratamento de dígitos significativos ao relatar os graus de liberdade (df) fosse baseado em julgamentos relacionados a números significativos.
O princípio é ser consistente : use a precisão em uma quantidade apropriada para a precisão usada em outra que esteja relacionada a ela. Especificamente, ao relatar os valores e quando é dado ao múltiplo mais próximo de um valor pequeno (como por seis lugares após o ponto decimal), a precisão relativa em mediada pela função éy = f ( x ) x h h = 1x y=f(x) x h yfh=12×10−6 y f
A aproximação se aplica quando é diferenciável continuamente no intervalo .[ x - h , x + h ]f [x−h,x+h]
No presente pedido, é o valor- , é o grau de liberdade ep x νy p x ν
onde é a estatística Welch-Satterthwaite e é o CDF da distribuição Student com graus de liberdade.F ν t νt Fν t ν
Para df relativamente alto , geralmente uma alteração na primeira casa decimal não altera o valor de p (para o nível de precisão relatado); portanto, arredondar para um número inteiro é bom ( mas é muito pequeno). Para df muito baixos e valores extremos da estatística , a magnitude da derivadapode exceder , sugerindo nesses casos que deve ser relatado com apenas uma casa decimal a menos que o próprio .ν h = 1 / 2 h | ddxf( X ) | t | ∂∂νFν(t)| 0.01 ν p
Veja você mesmo, com este gráfico de contorno da magnitude da derivada, o menor df (razoável) df e os intervalos deisso seria de interesse (porque eles podem levar a baixos valores de p).|t|
Os rótulos mostram o logaritmo de base 10 da derivada. Portanto, nos pontos entre e nesse gráfico, alterar o df relatado no lugar após o ponto decimal provavelmente mudará o valor p relatado apenas no e locais posteriores. Por exemplo, suponha que você esteja arredondando o valor de p para (seis casas decimais). Considere as estatísticas e . Eles estão localizados perto do contorno do log . Portanto, deve ser relatado para casas decimais.−k −(k+1) jth (j+k)th 10−6 ν=2.5 t=8 −3 ν 6+(−3)=3
As áreas em azul claro, para o maior , são as que mais preocupam, porque mostram onde pequenas mudanças em têm os maiores efeitos no valor-p.k ν
Compare isso com a situação para df mais alto (de a mostrados):4 30
A influência de na precisão de diminui rapidamente à medida que aumenta.ν p ν
fonte
A razão pela qual foi uma convenção é porque as tabelas não possuem um df não-integrante. Não há razão para fazê-lo de outra forma.
Bem, a estatística não tem uma distribuição t, porque o denominador ao quadrado não tem uma distribuição qui-quadrado em escala. É uma aproximação que pode ou não ser conservadora em um exemplo específico - o arredondamento de df para baixo pode não ser conservador quando consideramos a distribuição exata da estatística em um exemplo específico.
Os valores p das distribuições t (aplicando o cdf a uma estatística t) podem ser calculados por uma variedade de aproximações bastante precisas, para que sejam efetivamente calculados em vez de interpolados.
Concordo.
Uma possibilidade pode ser investigar a precisão da aproximação de Welch-Satterthwaite para o valor de p nessa região geral das razões de variância e não citar uma precisão relativa mais substancial do que a sugerida no df (tendo em mente que o df no o qui-quadrado no quadrado do denominador está apenas dando uma aproximação a algo que não é qui-quadrado de qualquer maneira).
fonte