Por exemplo, a estatística de teste calculada para o teste ANOVA é comparada a uma distribuição F, enquanto um meio de comparação do teste t compara a estatística do teste a uma distribuição t.
8
Por exemplo, a estatística de teste calculada para o teste ANOVA é comparada a uma distribuição F, enquanto um meio de comparação do teste t compara a estatística do teste a uma distribuição t.
Respostas:
A resposta completa para sua pergunta seria um curso de estatística de teoria matemática de semestre completo (o que seria uma boa idéia para você, se estiver realmente interessado).
Mas um conjunto curto e parcial de respostas são:
Geralmente, começamos com a distribuição normal, que foi considerada uma aproximação razoável para muitas situações do mundo real e o teorema do limite central (e outros) nos diz que é uma aproximação ainda melhor quando se olha para os meios de amostras aleatórias simples ( amostras maiores levam a uma melhor aproximação do normal). Portanto, o normal geralmente é a distribuição padrão a ser considerada se não houver um motivo para acreditar que não será uma aproximação razoável. Embora com computadores modernos seja mais fácil agora usar ferramentas não paramétricas ou outras e não precisamos depender tanto do normal (mas a história / inércia / etc. Nos mantém usando métodos normais).
Se você esquadrar uma variável que vem de uma distribuição normal padrão, ela segue uma distribuição qui-quadrado. Se você adicionar variáveis de um qui-quadrado, obtém outro qui-quadrado (graus de liberdade), o que significa que a variação (escalada) segue um qui-quadrado.
Ele também calcula que uma função da razão de verossimilhança segue uma distribuição qui-quadrado assintoticamente se o nulo for verdadeiro e outras suposições se mantiverem.
Um normal padrão dividido pela raiz quadrada de um qui-quadrado (e alguns parâmetros de escala) segue uma distribuição t, de modo que a estatística t comum (sob a hipótese nula) segue t.
A proporção de 2 quadrados de Chis (dividida por graus de liberdade e outras considerações) segue uma distribuição F. Os testes anova F são baseados na razão de 2 estimativas da mesma variância (sob o nulo) e, como as variações seguem um qui-quadrado, a razão segue um F (sob a nulidade e suposições).
Pessoas inteligentes elaboraram essas regras para que o resto de nós possa aplicá-las. Um curso completo de matemática / estatística fornecerá mais informações e derivações (e possivelmente mais alternativas); isso foi apenas uma rápida visão geral dos testes e distribuições mais comuns.
fonte
Uma maneira diferente de responder sua pergunta é o seguinte pensamento sequencial que eu gostaria de ilustrar com um exemplo simples:
1) Qual é a hipótese nula relacionada à questão de interesse? Por exemplo, nos EUA, a renda média é de US $ 6000 por mês.
2) Como podemos medir o desvio da hipótese nula com base nos dados disponíveis? Primeira tentativa: renda média. Quanto mais longe de 6000, menos plausível é a hipótese nula e mais devemos rejeitá-la.T=
3) Encontre a distribuição de se a hipótese nula for verdadeira. Essa "distribuição nula" é a base para a decisão de teste. Em nosso exemplo, se a amostra for grande, o Teorema do Limite Central nos diz que é normalmente normalmente distribuído com média 6000 e desvio padrão , em que é o verdadeiro desvio padrão da renda nos EUA. . Sabemos que e podem ser estimados pelo desvio padrão da amostra .T T σ/n−−√ σ n σ σ^
Principalmente, agora podemos recuar e usar esse resultado para encontrar decisões de teste. No entanto, como os estatísticos são bons, geralmente tentamos modificar a estatística do teste para manter a distribuição nula livre do máximo possível de informações dependentes de dados. Em nosso exemplo simples, podemos usar em vez de . Esta estatística de teste modificada é sempre aproximadamente normal normal se a hipótese nula for verdadeira. Independentemente do tamanho da amostra, da média hipotética e do desvio padrão, a decisão do teste é sempre baseada nos mesmos valores críticos (como ). Este é o famoso teste Z de uma amostra.
fonte
Existem apenas três distribuições baseadas na realidade. (1) O Binomial (2) O Multinomial (3) O aproximador de Abraham De Moivre ao binomial. As outras distribuições são expressões 'derivadas' com faixa dinâmica muito limitada e muito pouco contato com a realidade. Exemplo. Um estatístico lhe dirá que seus dados se ajustam a uma distribuição de Poisson. Ele realmente acreditará que a distribuição de Poisson tem algum tipo de realidade 'autônoma'. A verdade é que a distribuição de Poisson aproxima o binomial para quantidades muito pequenas e muito grandes de inclinação. Agora que todos nós temos computadores, não há razão para chamar aproximadores. Mas, infelizmente, velhos hábitos morrem com dificuldade.
fonte