A determinação da média e do DP implica a perda de um ou dois graus de liberdade?

7

Estou enfrentando algumas dúvidas ao entender como os graus de liberdade são considerados nas distribuições.

Em particular, vamos nos referir à variável Student, ou seja,t

(1)t=xx¯s^=xx¯(xix¯)2N1

Onde é uma variável gaussiana, é o valor médio, é o desvio padrão obtido dos dados.xx¯s^=(xix¯)2N1

A função densidade de probabilidade do aluno é

(2)f(t)=C(1+t2ν)ν+12

E no meu livro, encontro "porque em aparece o valor médio , calculado a partir dos dados, o que implica a perda de um grau de liberdade".ν=N1(1)x¯

Pergunta: Não deveria ser ? Em eu tenho e então existem dois parâmetros determinados a partir dos dados.ν=N2(1)s^x¯

Por outro lado, no segundo formulário que escrevi em , não aparece; portanto, talvez apenas deva ser considerado uma restrição aos dados. Mas isso não faz muito sentido.(1)s^x¯

Portanto, nesses casos em que o valor médio e o desvio padrão são determinados a partir dos dados, os graus de liberdade são perdidos 2 ou apenas 1?

Essa é uma dúvida mais geral: quando mais de um parâmetro é determinado a partir dos dados, mas de certa forma esses parâmetros estão relacionados (como é para e ), quantos graus de liberdade são perdidos se todos esses parâmetros forem considerados?x¯s^

Digamos, por exemplo, que eu determine parâmetros do mesmo conjunto de dados. Todos os parâmetros podem ser expressos como funções de dados e . Agora considero todos os parâmetros juntos: quantos graus de liberdade eu perdi? ou apenas ?qp1,p2,...,pqp2,...,pqp1q1

Sørën
fonte
Quando você calculou s ^, você já perdeu um df, então talvez ele esteja incorporado nele e, quando você usa s ^, não precisa levá-lo novamente em consideração?
EBH
Você está correto: isso não faz muito sentido. É por isso que essa expressão para nunca é usada! Na prática, comparamos a média dos dados com alguma outra estatística ou número, mas não usamos para comparar o indivíduo com sua média. Estou confiante de que a expressão em seu livro difere do que você está citando aqui. tx¯x1,,xntxi
whuber

Respostas:

1

A distribuição T é definida como a distribuição da razão de uma variável aleatória normal padrão e uma variável aleatória independente de escala de qui. Seu parâmetro de graus de liberdade é igual ao parâmetro de graus de liberdade da variável aleatória chi em seu denominador . Portanto, o parâmetro DF é uma questão de determinar os graus de liberdade do estimador de variância que você está usando.

Lembre-se: A distribuição T surge apenas quando você considera a razão de uma variável aleatória normal e um denominador que é algum tipo de estimador de desvio padrão (raiz quadrada de um estimador de variância). Isso pressupõe que já exista um estimador de variância na imagem. A perda de graus de liberdade ocorre então a partir da estimativa média (ou no contexto da regressão, a partir de múltiplas estimativas de coeficientes).


É possível formar quantidades semelhantes às mostradas e encontrar suas distribuições. Suponha que tenhamos e forme algum valor padronizado. Se assumirmos que é conhecido, mas é desconhecido, padronizaremos definindo a estatística T:X1,...,XnIID N(μ,σ2)μσ

TμXiμSμ=Xiμσ/SμσT(n),

onde é o estimador de variância da amostra com conhecido . A quantidade é uma variável aleatória com escala de chi com graus de liberdade, portanto a estatística tem uma distribuição T com graus de liberdade. Este é um caso de linha de base em que não houve perda de graus de liberdade, embora tenhamos estimado a variação.Sμ21ni=1n(Xiμ)2μSμ/σnTμn

Agora, no caso em que também é desconhecido, substituiríamos a média conhecida no estimador de variância pela média da amostra que temos:μμx¯

TXiμS=Xiμσ/SσT(n1),

onde é o estimador de variância da amostra com desconhecido . A quantidade é uma variável aleatória escalonada com graus de liberdade, portanto a estatística tem uma distribuição T com graus de liberdade. Perdemos um grau de liberdade devido à estimativa da média dentro do estimador de variância .S21n1i=1n(Xix¯)2μS/σn1Tn1


Espero que isso ajude você a entender esse problema. O conceito de graus de liberdade, dentro do contexto de falar sobre a distribuição T, pressupõe que já exista algum estimador de variância sendo usado para a alunoização. Estimar o parâmetro médio (ou parâmetros do coeficiente em uma regressão) altera esse estimador de variação, tornando-o menos variável, e isso implica uma perda de graus de liberdade.

Ben - Restabelecer Monica
fonte
0

Vamos considerar um exemplo para entender os graus de liberdade:

Finja que temos 5 observações . Se eu lhe disser a média desse conjunto de dados ( ), mas não os valores das próprias observações, você poderá criar quatro valores sem alterar a média. Se você escolher como suas quatro primeiras observações, o último número a ser escolhido deverá ser se a média for fixada em . Se apenas nos importamos com a média, temos uma equação e uma desconhecida.(1,2,1,3,5)2.4(3,4,3,5)32.4

Se você tiver observações com uma média fixa, terá a liberdade de escolher qualquer número que desejar, sem alterar a média - mas a observação é determinada. Observe, no entanto, que eu escolhi o valor de no parágrafo acima arbitrariamente, para poder escolher outra coisa. Portanto, tenho grau de liberdade dos dados e grau de liberdade porque escolhi a média; portanto, tenho graus de liberdade se estimar 1 parâmetro.nn1nth2.4n11n

Agora, digamos que eu lhe diga a média e o desvio padrão: para a mesma amostra de , a média é e o desvio padrão é . Agora eu posso escolher três dos cinco números, e os dois últimos serão determinados (duas equações, duas incógnitas). Os parâmetros são um pouco diferentes, no entanto, porque o desvio padrão da amostra é uma função da média da amostra - eles não são independentes um do outro. Isso significa que eu tenho graus de liberdade dos dados, mas ainda tenho apenas grau de liberdade dos parâmetros, para um total de graus de liberdade.(1,2,1,3,5)2.41.673n21n1

Consulte esta pergunta do Stack Exchange para obter mais informações.

Gabriel J. Odom
fonte
11
Você estava indo em uma boa direção, mas os comentários no final estão incorretos. O SD da amostra não é uma função da média da amostra (exceto as amostras 1). As observações sobre parâmetros parecem surgir do nada, implicitamente confundem dois conceitos de "independente" (estatístico e funcional), e não têm nenhuma relação clara com a questão das distribuições amostrais das estatísticas. As respostas para a pergunta no site de matemática são restritas e sem imaginação. A verdade é muito mais complexa e interessante: veja nosso tópico sobre este assunto em stats.stackexchange.com/questions/16921 .
whuber
11
Eu costumo usar esse exemplo para ensinar meus alunos do primeiro ano, mas obviamente falha sob qualquer verificação de rigor. Eu pensei que seria apropriado, dado o nível da pergunta, mas parece que eu estava errado. Não sei discutir tecnicamente graus de liberdade sem falar sobre a classificação da matriz Hat. Obrigado pelo link e feedback. Vou dar uma olhada.
Gabriel J. Odom
@ Whuber, obrigado por esse tópico. Tenho doutorado em estatística e não sabia metade do que você mencionou. Eu me sinto como um completo idiota agora.
Gabriel J. Odom
Não há necessidade de se sentir assim! A razão pela qual muitos de nós andamos aqui é que frequentemente lemos postagens que revelam quão pouco sabemos (ou melhor ainda, como o que pensávamos que sabíamos que não era assim), porque aprendemos muito com eles. Os mais ousados ​​(ou mais estúpidos), como eu, aprendem ainda mais se aventurando com frequência a responder e comentar, onde nossos erros se tornam evidentes para todos verem. (Fiz meu último comentário realmente estúpido há apenas cinco minutos ...).
whuber
Obrigado pelo incentivo Professor @whuber. Eu realmente aprecio isso :)
Gabriel J. Odom