Por que é necessário um teste t, uma vez que temos o teste z?

9

Alguém pode dar uma explicação de por que o teste t "acontece"? Fui ensinado a usar o teste t quando você não conhece o desvio padrão da população (ou seja, você sabe apenas o desvio padrão da sua amostra), mas não sei por que isso o tornaria diferente de um teste z .

jasonbogd
fonte
Atualizei seu título para responder à pergunta que acho que você está fazendo; fique à vontade para editar se eu tiver mal interpretado
Jeromy Anglim

Respostas:

3

Acho que não entendi completamente sua pergunta. Você está perguntando por que você usaria um teste t?

Se você entende por que usaria o teste z, deve ter uma boa idéia do porquê do teste t. Para amostras grandes, um teste z e um teste t devem render resultados semelhantes ou idênticos. Porém, embora um teste z assuma uma distribuição normal, um teste t levará em consideração a incerteza na distribuição das amostras em tamanhos de amostras menores.

Benjamin Mako Hill
fonte
3
Hmm, o teste t também assume uma distribuição normal. Talvez o que você quis dizer é que exigimos menos informações sobre essa distribuição.
JohnK
@ JohnK Eu não acho que faz sentido dizer que um teste assume uma distribuição em primeiro lugar, mas acho que Benjamin quis dizer que o escore t / estatística assume a distribuição T e não a distribuição Z.
Datoraki
3

O teste z em si é, na verdade, um teste de razão de probabilidade entre a probabilidade assumindo a hipótese nula e a probabilidade assumindo a hipótese alternativa. Assumindo distribuições normais subjacentes com variações conhecidas e testando apenas os meios, a álgebra simplifica para o teste z que conhecemos e amamos (DeGroot 1986, pp. 442-447).

Usar o mesmo procedimento de máxima verossimilhança, mas tratar a variação como um desconhecido, cria um par diferente de probabilidades e sua razão, e deixar a álgebra simplificada fornece a estatística: (DeGroot 1986, pp. 485–489). A distribuição de teste em questão também muda, pois o numerador da estatística acima é normalmente distribuído, , e o denominador é distribuído como raiz quadrada de normais ao quadrado, o , que é a raiz quadrada de um variável aleatória qui-quadrado. Gosset (Aluno) mostrou que se você tiver uma variável aleatória: ˉXS2YN(0,1)

n(X¯nμ0)Sn2n1
X¯S2
YN(0,1)Zχn2XYZn
então X é distribuído com a distribuição te n graus de liberdade.

Portanto, para declarar isso sem rigor, o teste t é o resultado natural do mesmo processo de razão de verossimilhança que está por trás do teste z quando a variação dos dados é desconhecida e está sendo estimada através da máxima verossimilhança.

Avraham
fonte
11
isso foi muito esclarecedor. Eu tinha esquecido completamente que o teste t vem do máximo de probabilidade possível
Moderado
1

A resposta não rigorosa é que você deseja usar um teste t quando tiver um pequeno número de amostras devido à chance de as amostras estarem incomumente próximas (em relação à variação real da população). Nesse caso, o denominador na fórmula da estatística t será extraordinariamente pequeno e, portanto, a estatística t em si será extraordinariamente grande. Portanto, é muito mais provável que você obtenha um valor grande para o stat-t quando tiver um número pequeno de amostras do que obteria um stat-z comparativamente grande; portanto, é necessário um valor maior para rejeitar o nulo usando o teste t que o teste z no mesmo nível de significância.

Evan Wright
fonte
Acho o argumento atraente, mas, refletindo, pouco convincente. Afinal, se por acaso as amostras estiverem invulgarmente afastadas (o que deve acontecer tão facilmente quanto estar invulgarmente próximas), parece que a mesma lógica levaria à conclusão oposta.
whuber
0

O diferenciador mais importante é o tamanho da amostra, como regra geral: se for menor que um teste t deve ser usado, caso contrário, um teste z.30n30

Uma boa visão geral das suposições e diferenças subjacentes (e semelhanças) de ambos os testes é fornecida aqui:
http://www.le.ac.uk/bl/gat/virtualfc/Stats/ttest.html

vonjd
fonte