Suponha um teste t de uma amostra, em que a hipótese nula é . A estatística é então usando o desvio padrão da amostra . Na estimativa de s , compara-se as observações com a média da amostra ¯ x : s
.
No entanto, se assumirmos que um dado é verdadeiro, também é possível estimar o desvio padrão s ∗ usando µ 0 em vez da média da amostra ¯ x :
.
Para mim, essa abordagem parece mais natural, pois, consequentemente, usamos a hipótese nula também para estimar o DP. Alguém sabe se a estatística resultante é usada em um teste ou sabe, por que não?
mathematical-statistics
variance
t-test
Michael
fonte
fonte
Respostas:
Houve um problema com a simulação original neste post, que agora está corrigido.
Embora a estimativa do desvio padrão da amostra tenda a crescer junto com o numerador, à medida que a média se desvia de , isso resulta em não ter um efeito tão grande na potência em níveis de significância "típicos", porque em amostras médias e grandes, s ∗ / √μ0 0 ainda tende a ser grande o suficiente para rejeitar. Porém, em amostras menores, pode ter algum efeito, e em níveis de significância muito pequenos, isso pode se tornar muito importante, porque colocará um limite superior na potência que será menor que 1.s∗/ n--√
Isso significa que o teste não tem mais uma distribuição t abaixo do nulo. Não é uma falha fatal, mas significa que você não pode simplesmente usar tabelas e obter o nível de significância que deseja (como veremos em um minuto). Ou seja, o teste se torna conservador e isso afeta o poder.
À medida que n se torna grande, essa dependência se torna menos problemática (principalmente porque você pode invocar o CLT para o numerador e usar o teorema de Slutsky para dizer que há uma distribuição normal assintótica para a estatística modificada).
Você pode ver que a curva de potência é mais baixa (piora com tamanhos de amostra mais baixos), mas muito disso parece ser porque a dependência entre numerador e denominador diminuiu o nível de significância. Se você ajustar os valores críticos adequadamente, haveria pouco entre eles, mesmo em n = 10.
Isso sugere que, em tamanhos de amostra não pequenos, não há muito entre eles, desde que você não precise usar níveis de significância muito pequenos.
fonte
fonte