Alguém pode dar uma explicação de por que o teste t "acontece"? Fui ensinado a usar o teste t quando você não conhece o desvio padrão da população (ou seja, você sabe apenas o desvio padrão da sua amostra), mas não sei por que isso o tornaria diferente de um teste z .
hypothesis-testing
t-test
jasonbogd
fonte
fonte
Respostas:
Acho que não entendi completamente sua pergunta. Você está perguntando por que você usaria um teste t?
Se você entende por que usaria o teste z, deve ter uma boa idéia do porquê do teste t. Para amostras grandes, um teste z e um teste t devem render resultados semelhantes ou idênticos. Porém, embora um teste z assuma uma distribuição normal, um teste t levará em consideração a incerteza na distribuição das amostras em tamanhos de amostras menores.
fonte
O teste z em si é, na verdade, um teste de razão de probabilidade entre a probabilidade assumindo a hipótese nula e a probabilidade assumindo a hipótese alternativa. Assumindo distribuições normais subjacentes com variações conhecidas e testando apenas os meios, a álgebra simplifica para o teste z que conhecemos e amamos (DeGroot 1986, pp. 442-447).
Usar o mesmo procedimento de máxima verossimilhança, mas tratar a variação como um desconhecido, cria um par diferente de probabilidades e sua razão, e deixar a álgebra simplificada fornece a estatística: (DeGroot 1986, pp. 485–489). A distribuição de teste em questão também muda, pois o numerador da estatística acima é normalmente distribuído, , e o denominador é distribuído como raiz quadrada de normais ao quadrado, o , que é a raiz quadrada de um variável aleatória qui-quadrado. Gosset (Aluno) mostrou que se você tiver uma variável aleatória: ˉXS2Y∼N(0,1)
Portanto, para declarar isso sem rigor, o teste t é o resultado natural do mesmo processo de razão de verossimilhança que está por trás do teste z quando a variação dos dados é desconhecida e está sendo estimada através da máxima verossimilhança.
fonte
A resposta não rigorosa é que você deseja usar um teste t quando tiver um pequeno número de amostras devido à chance de as amostras estarem incomumente próximas (em relação à variação real da população). Nesse caso, o denominador na fórmula da estatística t será extraordinariamente pequeno e, portanto, a estatística t em si será extraordinariamente grande. Portanto, é muito mais provável que você obtenha um valor grande para o stat-t quando tiver um número pequeno de amostras do que obteria um stat-z comparativamente grande; portanto, é necessário um valor maior para rejeitar o nulo usando o teste t que o teste z no mesmo nível de significância.
fonte
O diferenciador mais importante é o tamanho da amostra, como regra geral: se for menor que um teste t deve ser usado, caso contrário, um teste z.30n 30
Uma boa visão geral das suposições e diferenças subjacentes (e semelhanças) de ambos os testes é fornecida aqui:
http://www.le.ac.uk/bl/gat/virtualfc/Stats/ttest.html
fonte