Relatórios de graus de liberdade para o teste t de Welch

14

O teste t de Welch para variações desiguais (também conhecido como Welch-Satterthwaite ou Welch-Aspin) geralmente possui graus de liberdade não inteiros . Como esses graus de liberdade devem ser citados ao relatar os resultados do teste?

"É convencional arredondar para o número inteiro mais próximo antes de consultar as tabelas t padrão" de acordo com várias fontes * - o que faz sentido, pois essa direção de arredondamento é conservadora. ** Algum software estatístico mais antigo também faria isso (por exemplo, Graphpad Prism antes da versão 6 ) e algumas calculadoras online ainda o fazem. Se esse procedimento tivesse sido usado, relatar os graus de liberdade arredondados parece apropriado. (Embora o uso de um software melhor possa ser ainda mais apropriado!)

Mas a grande maioria dos pacotes modernos utiliza a parte fracionária, portanto, neste caso, parece que a parte fracionária deve ser citada. Não vejo como apropriado citar mais de duas casas decimais, pois um milésimo de grau de liberdade teria apenas um impacto insignificante no valor- p .

Olhando ao redor do Google Scholar, posso ver trabalhos citando o df como um número inteiro, com uma casa decimal ou duas casas decimais. Existem diretrizes sobre quanta precisão usar? Além disso, se o software utilizado na parte fraccionada completo, no caso do citado df ser arredondado para baixo para o número desejado de valores (por exemplo, para 1 ou dp como um número inteiro), desde que apropriado com o cálculo conservador, ou como me parece mais sensato, arredondado convencionalmente ( para o mais próximo ), de modo que a 1 dp ou ao todo mais próximo?7.5845...7.577.5845...7.68

Editar: além de conhecer a maneira mais teoricamente correta de relatar df não inteiro, também seria bom saber o que as pessoas fazem na prática . Presumivelmente, os periódicos e os guias de estilo têm seus próprios requisitos. Gostaria de saber o que guias de estilo influentes como o APA exigem. Pelo que posso discernir (o manual deles não está disponível gratuitamente on-line), a APA tem uma preferência geral de que quase tudo deve aparecer com duas casas decimais, exceto os valores de p (que podem ser de dois ou três pontos) e as porcentagens (arredondadas para o porcentagem mais próxima) - que abrange inclinações de regressão, estatísticas t , estatísticas F , χ2estatísticas e assim por diante. Isso é bastante ilógico, tendo em mente que a segunda casa decimal ocupa um número significativo muito diferente e sugere uma precisão bastante diferente, em 2,47 do que em 982,47, mas pode explicar o número de Welch df com duas casas decimais que vi na minha amostra não científica .

por exemplo, Ruxton, GD O teste t de variação desigual é uma alternativa subutilizada ao teste t de Student e ao teste U de Mann-Whitney , Ecologia comportamental (julho / agosto de 2006) 17 (4): 688-690 doi: 10.1093 / beheco / ark016

Embora a própria aproximação de Welch-Satterthwaite possa ou não ser conservadora, e em um caso em que não seja conservadora, arredondar os graus de liberdade não é garantia de compensação geral.

Silverfish
fonte
1
Não estudei a prática real - e é por isso que este é um comentário e não uma resposta - mas espero que seja baseado em julgamentos relacionados ao relato de números significativos. Para df relativamente alto, geralmente uma alteração na primeira casa decimal não altera o valor de p (para o nível de precisão relatado); portanto, arredondar para um número inteiro é bom. Para df muito baixos e valores extremos de , a derivadapode exceder , sugerindo nesses casos que deve ser relatado com apenas um número menos significativo que o próprio . t | νt0,01νp|νFν(t)|0.01νp
whuber
@whuber Essa é realmente uma observação útil, principalmente quando tomada em conjunto com a resposta de Glen_b. Quão baixo é "muito baixo" para ? (Minha suspeita na amostra de artigos que me deparei é que muita "prática real" pode não ser a mesma coisa que "boa prática"! Suspeito que o acompanhamento robótico de diretrizes tenha tanto efeito quanto julgamento, e é por isso que seria interessante para saber o que são diretrizes comuns de geração de relatórios.)ν
Silverfish

Respostas:

10

Como não estudei a prática real, essa resposta não pode abordar esse aspecto da questão. Como princípio geral, eu esperaria que o tratamento de dígitos significativos ao relatar os graus de liberdade (df) fosse baseado em julgamentos relacionados a números significativos.

O princípio é ser consistente : use a precisão em uma quantidade apropriada para a precisão usada em outra que esteja relacionada a ela. Especificamente, ao relatar os valores e quando é dado ao múltiplo mais próximo de um valor pequeno (como por seis lugares após o ponto decimal), a precisão relativa em mediada pela função éy = f ( x ) x h h = 1xy=f(x)xhyfh=12×106yf

suphkh|f(x+k)f(x)|h|ddxf(x)|.

A aproximação se aplica quando é diferenciável continuamente no intervalo .[ x - h , x + h ]f[xh,x+h]

No presente pedido, é o valor- , é o grau de liberdade ep x νypxν

y=f(x)=f(ν)=Fν(t)

onde é a estatística Welch-Satterthwaite e é o CDF da distribuição Student com graus de liberdade.F ν t νtFνtν

Para df relativamente alto , geralmente uma alteração na primeira casa decimal não altera o valor de p (para o nível de precisão relatado); portanto, arredondar para um número inteiro é bom ( mas é muito pequeno). Para df muito baixos e valores extremos da estatística , a magnitude da derivadapode exceder , sugerindo nesses casos que deve ser relatado com apenas uma casa decimal a menos que o próprio .νh=1/2h|ddxf(x)|t|νFν(t)|0.01νp

Veja você mesmo, com este gráfico de contorno da magnitude da derivada, o menor df (razoável) df e os intervalos deisso seria de interesse (porque eles podem levar a baixos valores de p).|t|

Figura

Os rótulos mostram o logaritmo de base 10 da derivada. Portanto, nos pontos entre e nesse gráfico, alterar o df relatado no lugar após o ponto decimal provavelmente mudará o valor p relatado apenas no e locais posteriores. Por exemplo, suponha que você esteja arredondando o valor de p para (seis casas decimais). Considere as estatísticas e . Eles estão localizados perto do contorno do log . Portanto, deve ser relatado para casas decimais.k(k+1)jth(j+k)º106ν=2.5t=83ν6+(3)=3

As áreas em azul claro, para o maior , são as que mais preocupam, porque mostram onde pequenas mudanças em têm os maiores efeitos no valor-p.kν

Compare isso com a situação para df mais alto (de a mostrados):430

Figura 2

A influência de na precisão de diminui rapidamente à medida que aumenta.νpν

whuber
fonte
1
Essa foi uma contribuição muito útil para estabelecer por quais princípios se deve arredondar os graus de liberdade (+50!); Espero que alguém que responda mais tarde possa preencher as lacunas sobre a prática real.
Silverfish
7

É convencional arredondar para o número inteiro mais próximo antes de consultar as tabelas t padrão

A razão pela qual foi uma convenção é porque as tabelas não possuem um df não-integrante. Não há razão para fazê-lo de outra forma.

o que faz sentido, pois esse ajuste é conservador.

Bem, a estatística não tem uma distribuição t, porque o denominador ao quadrado não tem uma distribuição qui-quadrado em escala. É uma aproximação que pode ou não ser conservadora em um exemplo específico - o arredondamento de df para baixo pode não ser conservador quando consideramos a distribuição exata da estatística em um exemplo específico.

(por interpolação ou triturando os números da distribuição t com esse df?)

Os valores p das distribuições t (aplicando o cdf a uma estatística t) podem ser calculados por uma variedade de aproximações bastante precisas, para que sejam efetivamente calculados em vez de interpolados.

Não vejo como apropriado citar mais de duas casas decimais

Concordo.

Existem diretrizes sobre quanta precisão usar?

Uma possibilidade pode ser investigar a precisão da aproximação de Welch-Satterthwaite para o valor de p nessa região geral das razões de variância e não citar uma precisão relativa mais substancial do que a sugerida no df (tendo em mente que o df no o qui-quadrado no quadrado do denominador está apenas dando uma aproximação a algo que não é qui-quadrado de qualquer maneira).

Glen_b -Reinstate Monica
fonte
1
Eu deveria ter esclarecido que "o arredondamento é conservador". A própria aproximação de Welch-Satterthwaite pode ou não ser conservadora. Mas o processo de arredondamento certamente é - se a aproximação não era conservadora para começar, é pelo menos menos ruim depois do arredondamento. Por outro lado, arredondar para cima (por exemplo, "7,5845 arredondamentos mais próximos de 8") definitivamente não é um ajuste conservador. Eu poderia encontrar uma maneira melhor de expressar isso, mas espero que meu argumento seja claro!
quer
"Uma possibilidade pode ser investigar a precisão da aproximação de Welch-Satterthwaite para o valor-p nessa região geral das razões de variância" - isso é muito sensato e parece ser a abordagem baseada em princípios. Isso é algo comumente feito? Algumas dicas para implementação seriam boas. Na prática, suspeito que as diretrizes de estilo de periódico geralmente tenham a palavra final sobre o assunto! Mas eu não sei o que eles dizem - havia definitivamente uma variedade de práticas nos artigos que minha pesquisa apareceu.
quer
Para tentar evitar confusão com os futuros leitores, tentei esclarecer o arredondamento conservador no corpo da pergunta. Obrigado por pegar isso.
Silverfish
Eu não acho que nada parecido seja feito com frequência, mas não acho que isso signifique que não deva ser. Quanto de explicar por que alguém dá uma volta / trunca a um certo ponto entra no jornal dependeria claramente do diário / editor / árbitro.
Glen_b -Reinstate Monica