Como os estatísticos determinam qual distribuição é apropriada para diferentes testes estatísticos?

8

Por exemplo, a estatística de teste calculada para o teste ANOVA é comparada a uma distribuição F, enquanto um meio de comparação do teste t compara a estatística do teste a uma distribuição t.

Stu
fonte
1
Para uma visão geral, dê uma olhada na página 3 deste documento . Ele contém um gráfico que descreve os relacionamentos entre muitas distribuições. Bastante limpo.
COOLSerdash
Em um nível, a resposta é simples: a distribuição é a da estatística de teste sob a hipótese nula. Achar isso é apenas um cálculo. As partes difíceis estão criando um modelo de probabilidade adequado para um problema, provocando uma função de perda e encontrando uma estatística de teste que produz um bom teste. Muitas distribuições, incluindo Normal, e , na verdade aparecem mais frequentemente como aproximações assintóticas das distribuições reais (e aí reside uma parte separada de qualquer boa resposta). tχ2
whuber

Respostas:

12

A resposta completa para sua pergunta seria um curso de estatística de teoria matemática de semestre completo (o que seria uma boa idéia para você, se estiver realmente interessado).

Mas um conjunto curto e parcial de respostas são:

Geralmente, começamos com a distribuição normal, que foi considerada uma aproximação razoável para muitas situações do mundo real e o teorema do limite central (e outros) nos diz que é uma aproximação ainda melhor quando se olha para os meios de amostras aleatórias simples ( amostras maiores levam a uma melhor aproximação do normal). Portanto, o normal geralmente é a distribuição padrão a ser considerada se não houver um motivo para acreditar que não será uma aproximação razoável. Embora com computadores modernos seja mais fácil agora usar ferramentas não paramétricas ou outras e não precisamos depender tanto do normal (mas a história / inércia / etc. Nos mantém usando métodos normais).

Se você esquadrar uma variável que vem de uma distribuição normal padrão, ela segue uma distribuição qui-quadrado. Se você adicionar variáveis ​​de um qui-quadrado, obtém outro qui-quadrado (graus de liberdade), o que significa que a variação (escalada) segue um qui-quadrado.

Ele também calcula que uma função da razão de verossimilhança segue uma distribuição qui-quadrado assintoticamente se o nulo for verdadeiro e outras suposições se mantiverem.

Um normal padrão dividido pela raiz quadrada de um qui-quadrado (e alguns parâmetros de escala) segue uma distribuição t, de modo que a estatística t comum (sob a hipótese nula) segue t.

A proporção de 2 quadrados de Chis (dividida por graus de liberdade e outras considerações) segue uma distribuição F. Os testes anova F são baseados na razão de 2 estimativas da mesma variância (sob o nulo) e, como as variações seguem um qui-quadrado, a razão segue um F (sob a nulidade e suposições).

Pessoas inteligentes elaboraram essas regras para que o resto de nós possa aplicá-las. Um curso completo de matemática / estatística fornecerá mais informações e derivações (e possivelmente mais alternativas); isso foi apenas uma rápida visão geral dos testes e distribuições mais comuns.

Greg Snow
fonte
Obrigado, é exatamente isso que eu estava procurando. Acho que vou adiar o curso de estatísticas da teoria matemática por enquanto.
Stu
3

Uma maneira diferente de responder sua pergunta é o seguinte pensamento sequencial que eu gostaria de ilustrar com um exemplo simples:

1) Qual é a hipótese nula relacionada à questão de interesse? Por exemplo, nos EUA, a renda média é de US $ 6000 por mês.

2) Como podemos medir o desvio da hipótese nula com base nos dados disponíveis? Primeira tentativa: renda média. Quanto mais longe de 6000, menos plausível é a hipótese nula e mais devemos rejeitá-la.T=

3) Encontre a distribuição de se a hipótese nula for verdadeira. Essa "distribuição nula" é a base para a decisão de teste. Em nosso exemplo, se a amostra for grande, o Teorema do Limite Central nos diz que é normalmente normalmente distribuído com média 6000 e desvio padrão , em que é o verdadeiro desvio padrão da renda nos EUA. . Sabemos que e podem ser estimados pelo desvio padrão da amostra .TTσ/nσnσσ^

Principalmente, agora podemos recuar e usar esse resultado para encontrar decisões de teste. No entanto, como os estatísticos são bons, geralmente tentamos modificar a estatística do teste para manter a distribuição nula livre do máximo possível de informações dependentes de dados. Em nosso exemplo simples, podemos usar em vez de . Esta estatística de teste modificada é sempre aproximadamente normal normal se a hipótese nula for verdadeira. Independentemente do tamanho da amostra, da média hipotética e do desvio padrão, a decisão do teste é sempre baseada nos mesmos valores críticos (como ). Este é o famoso teste Z de uma amostra.

T=(T6000)/(σ^/n)
TT±1.96
Michael M
fonte
-2

Existem apenas três distribuições baseadas na realidade. (1) O Binomial (2) O Multinomial (3) O aproximador de Abraham De Moivre ao binomial. As outras distribuições são expressões 'derivadas' com faixa dinâmica muito limitada e muito pouco contato com a realidade. Exemplo. Um estatístico lhe dirá que seus dados se ajustam a uma distribuição de Poisson. Ele realmente acreditará que a distribuição de Poisson tem algum tipo de realidade 'autônoma'. A verdade é que a distribuição de Poisson aproxima o binomial para quantidades muito pequenas e muito grandes de inclinação. Agora que todos nós temos computadores, não há razão para chamar aproximadores. Mas, infelizmente, velhos hábitos morrem com dificuldade.

user10739
fonte
1
Uma tese interessante e instigante, mas, em última análise, menos que útil neste contexto. Além disso, sua verdade parece repousar em uma idéia idiossincrática e limitada de "baseado na realidade". (Para justificar essa alegação de limitado, considerar - entre muitos exemplos - o que seria necessário para distribuições da deriva como o hypergeometric ou Benford das três distribuições chamado aqui.)
whuber
Não vejo como um computador alivia a necessidade de aproximar o modelo subjacente a um processo complexo. As pessoas não estão usando a regressão de Poisson porque seus dados foram gerados a partir de um grande número de tentativas de Bernoulli, onde a probabilidade de sucesso diminui proporcionalmente ao número de tentativas e elas querem apenas salvar o problema do computador. Eles o usam porque é um modelo simples para testar como as covariáveis ​​afetam a média de um resultado de contagem. Um profissional astuto verifica as suposições de seus modelos, mas, até que os computadores se tornem psíquicos, usaremos modelos para aproximar a realidade.
Macro
Nas ciências da vida, é importante testar conjuntos de dados em relação à distribuição binomial. Fazer isso nos dá uma medida do número total de 'fontes de erro' que corresponde ao número de genes que influenciam o processo. A distribuição de Poisson, entre outros, obscurece esse relacionamento.
user10739