Quais são os graus de liberdade de uma distribuição?

10

Estou lidando agora com muitas distribuições, por exemplo, , t , χ 2 .Ftχ2

Fiquei me perguntando por que esses graus de liberdade significam distribuições como a distribuição ?F(m,n)

Le Max
fonte
3
Consulte stats.stackexchange.com/questions/16921/… . A resposta que mais direciona sua pergunta é stats.stackexchange.com/a/16931 ; as outras respostas fornecem vários aprimoramentos e maneiras adicionais de entender os graus de liberdade. Em outras partes da Web, a melhor conta que posso encontrar dessa família de distribuições está em rip94550.wordpress.com/2012/07/30/… . Melhores explicações aparecem nos textos; meu favorito é JC Kiefer, introdução. para Stat. Inferência , pp 265 e segs.
whuber
O @maximus whuber fornece uma resposta muito detalhada em seu segundo link. É muito interessante, porque fala sobre todos os conceitos errados e más definições dadas no artigo da wikipedia mencionado nesse post.
Michael R. Chernick

Respostas:

11

Aqui está uma resposta menos técnica, talvez mais acessível para pessoas com preparação matemática modesta.

O termo graus de liberdade (df) é usado em conexão com várias estatísticas de teste, mas seu significado varia de um teste estatístico para o próximo. Alguns testes não têm graus de liberdade associados à estatística do teste (por exemplo, teste exato de Fisher ou teste z). Quando fazemos um teste az, o valor z que calculamos com base em nossos dados pode ser interpretado com base em uma única tabela de valores z críticos, independentemente de quão grandes ou pequenas sejam nossas amostras. Outra maneira de dizer isso é que existe uma distribuição z. Isso não acontece em alguns outros testes (por exemplo, F ou t ou χ2).

A razão pela qual muitas estatísticas de teste precisam ser interpretadas à luz de df é que a distribuição (teórica) dos valores da estatística de teste, assumindo que a hipótese nula é verdadeira, depende do tamanho da amostra ou número de grupos, ou ambos, ou algum outro fato sobre os dados coletados. Ao fazer um teste t, a distribuição dos valores t depende do tamanho da amostra, portanto, quando avaliamos o valor t calculado a partir dos dados observados, precisamos compará-lo aos valores t esperados com base no mesmo tamanho da amostra que nossos dados. Da mesma forma, a distribuição dos valores de F em uma Análise de Variância (assumindo que a hipótese nula é verdadeira) depende do tamanho da amostra e do número de grupos. Portanto, para interpretar o valor F calculado a partir de nossos dados, precisamos usar tabelas de valores F baseados no mesmo tamanho de amostra e no mesmo número de grupos que temos em nossos dados. Dito isso de maneira diferente, os testes F (ou seja, ANOVAs) e os testes t e χ2 exigem uma família de curvas para nos ajudar a interpretar o valor de t ou F ou χ2 que calculamos com base em nossos dados. Escolhemos dentre essas famílias de curvas com base em valores (ou seja, df), para que as probabilidades que lemos das tabelas sejam apropriadas para nossos dados. (Obviamente, a maioria dos programas de computador faz isso por nós.)

Joel W.
fonte
3
+1 Trabalho realmente maravilhoso: ver o cerne da questão e explicá-lo claramente.
whuber
0

A distribuição F é a razão de duas distribuição central do qui-quadrado. Om é o grau de liberdade associado à variável aleatória qui-quadrado que representa o numerador en é o grau de liberdade do qui-quadrado para o denominador. Para completar a resposta à sua pergunta, preciso explicar os graus de liberdade do qui-quadrado. Uma distribuição qui-quadrado com n graus de liberdade pode ser representada como a soma dos quadrados de n variáveis ​​aleatórias N (0,1) independentes. Portanto, os graus de liberdade podem ser vistos como o número de variáveis ​​aleatórias normais que aparecem na soma.

ibi

2ib22b

2

Michael R. Chernick
fonte