Explicação para graus de liberdade não inteiros no teste t com variações desiguais

15

O procedimento do teste t SPSS relata 2 análises ao comparar duas médias independentes, uma análise com variâncias iguais assumidas e outra com variâncias iguais não assumidas. Os graus de liberdade (df) quando pressões iguais são assumidas são sempre valores inteiros (e iguais n-2). O df quando variações diferentes não são assumidas não é um número inteiro (por exemplo, 11.467) e nem chega perto de n-2. Estou procurando uma explicação da lógica e do método usado para calcular esses df não inteiros.

Joel W.
fonte
3
Uma apresentação em PowerPoint da Universidade da Flórida contém um bom relato de como essa aproximação à distribuição amostral da estatística Student t é derivada para o caso de variações desiguais.
whuber
O teste t de Welch é sempre mais preciso? Existe uma desvantagem em usar a abordagem Welch?
Joel W.
Se o Welch e o teste t original produzem p dramaticamente diferentes, com que devo ir? E se o valor de p para as diferenças de variação for apenas 0,06, mas as diferenças nos valores de p dos dois testes t forem 0,000 e 0,121? (Isto ocorreu quando um grupo de dois não tinham variância e o outro grupo de 25 tinham uma variação de 70 mil.)
Joel W.
2
Não escolha entre eles com base no valor de p . A menos que você tenha um bom motivo (antes mesmo de ver os dados) para assumir uma variação igual, simplesmente não faça essa suposição.
Glen_b -Reinstate Monica
1
Todas as perguntas estão relacionadas a quando usar o teste Welch. Esta questão foi publicada em stats.stackexchange.com/questions/116610/…
Joel W.

Respostas:

11

Pode-se mostrar que o Welch-Satterthwaite df é uma média harmônica ponderada em escala dos dois graus de liberdade, com pesos na proporção dos desvios padrão correspondentes.

A expressão original diz:

νW=(s12n1+s22n2)2s14n12ν1+s24n22ν2

Note-se que é a variância estimada do i th da amostra média ou o quadrado da i -ésima erro padrão da média . Seja r = r 1 / r 2 (a razão entre as variações estimadas da amostra significa), entãori=si2/niithir=r1/r2

νW=(r1+r2)2r12ν1+r22ν2=(r1+r2)2r12+r22r12+r22r12ν1+r22ν2=(r+1)2r2+1r12+r22r12ν1+r22ν2

O primeiro fator é , que aumenta de 1 em r = 0 a 2 em r = 1 e depois diminui para 1 em r = ; é simétrico no log r .1+sech(log(r))1r=02r=11r=logr

O segundo fator é uma média harmônica ponderada :

H(x_)=i=1nwii=1nwixi.

do df, onde são os pesos relativos aos dois dfwi=ri2

Ou seja, quando é muito grande, converge para ν 1 . Quando r 1 / r 2 está muito próximo de 0 , converge para ν 2 . Quando R 1 = r 2 -lhe obter duas vezes a média harmónica do df, e quando s 2 1 = s 2 2 -lhe obter a igualdade de variância-df t-teste usual, que é também o valor máximo possível para ν W .r1/r2ν1r1/r20ν2r1=r2s12=s22νW

-

Com um teste t de variância igual, se as premissas se mantiverem, o quadrado do denominador é uma constante vezes uma variável aleatória qui-quadrado.

O quadrado do denominador do teste t de Welch não é (um tempo constante) um qui-quadrado; no entanto, muitas vezes não é uma aproximação muito ruim. Uma discussão relevante pode ser encontrada aqui .

Uma derivação mais no estilo de livro didático pode ser encontrada aqui .

Glen_b -Reinstate Monica
fonte
1
Grande insight sobre a média harmônica, que é mais apropriada do que a média aritmética para as médias das relações.
Felipe G. Nievinski 01/09/16
10

O que você está se referindo é a correção de Welch-Satterthwaite nos graus de liberdade. O teste quando a correção WS é aplicada é frequentemente chamado de teste t de Welch . (Aliás, isso não tem nada a ver com SPSS, todo o software de estatística será capaz de conduzir de Welch tttttts12/n1s22/n2t

Repor a Monica
fonte
Para um teste t, o SPSS relata o df como 26,608, mas os ns para os dois grupos são 22 e 104. Você tem certeza sobre "O df apropriado deve estar em algum lugar entre o df completo e o df do grupo maior"? (Os desvios padrão são 10,5 e 8,1 para os grupos mais pequenos e maiores, respectivamente.)
Joel W.
2
Depende dos tamanhos relativos de s12/n1 vs s22/n2. Se o maiorn is associated with a sufficiently larger variance, the combined d.f. can be lower than the larger of the two d.f. Note that the Welch t-test is only approximate, since the squared denominator is not actually a (scaled) chi-square random variate. However in practice it does quite well.
Glen_b -Reinstate Monica
I think I'll expand on the relationship between the relative sizes of the (si2/ni) and the Welch d.f. in an answer (since it won't fit in a comment).
Glen_b -Reinstate Monica
1
@ Glen_b, tenho certeza de que será de grande valor aqui.
gung - Restabelece Monica