Por que os graus de liberdade para um par combinado testam o número de pares menos 1?

9

Estou acostumado a conhecer "graus de liberdade" como , onde você tem o modelo linear \ mathbf {y} = \ mathbf {X} \ boldsymbol {\ beta} + \ boldsymbol {\ epsilon} com \ mathbf {y } \ in \ mathbb {R} ^ n , \ mathbf {X} \ em M_ {n \ vezes p} (\ mathbb {R}) a matriz de design com classificação r , \ boldsymbol {\ beta} \ in \ mathbb { R} ^ p , \ boldsymbol {\ epsilon} \ in \ mathbb {R} ^ n com \ boldsymbol {\ epsilon} \ sim \ mathcal {N} (\ mathbf {0}, \ sigma ^ 2 \ mathbf {I} _n) , \ sigma ^ 2> 0 .nr

y=Xβ+ϵ
yRnXMn×p(R)rβRpϵRnϵN(0,σ2In)σ2>0

Pelo que me lembro de estatística elementar (ou seja, modelos pré-lineares com álgebra linear), os graus de liberdade para o teste t de pares combinados té o número de diferenças menos 1 . Portanto, isso implicaria que X possua a classificação 1, talvez. Isso está correto? Caso contrário, por que n1 o grau de liberdade para o teste t de pares combinados t?

Para entender o contexto, suponha que eu tenha um modelo de efeitos mistos

yijk=μi+ some random effects+eijk
que i=1,2 , j=1,,8 e k=1,2 . Não há nada de especial em μi senão que é um efeito fixo e eijkiidN(0,σe2) . Estou assumindo que os efeitos aleatórios são irrelevantes para esse problema, já que nos preocupamos apenas com os efeitos fixos neste caso.

Gostaria de fornecer um intervalo de confiança para μ1μ2 .

Eu já mostrei que d¯=18dj é um estimador imparcial de μ1μ2 , em que dj=y¯1jy¯2j , y¯1j=12ky1jk e y¯21 é definido da mesma forma. A estimativa pontual d¯ foi calculada.

Eu já mostrei que

sd2=j(djd¯)281
é um estimador imparcial da variação de dj , e portanto,
sd28
é o erro padrão de d¯ . Isso foi calculado.

Agora, a última parte é descobrir os graus de liberdade. Para esta etapa, geralmente tento encontrar a matriz de design - que obviamente possui o rank 2 - mas tenho a solução para esse problema e diz que os graus de liberdade são .81

No contexto de encontrar a classificação de uma matriz de design, por que os graus de liberdade são ?81

Editado para adicionar: Talvez útil nesta discussão seja como a estatística de teste é definida. Suponha que eu tenha um vetor de parâmetro . Nesse caso, (a menos que eu esteja perdendo algo completamente). Estamos essencialmente realizando o teste de hipótese que . Em seguida, a estatística de teste é fornecida por que seriam testados contra uma distribuição central comβ

β=[μ1μ2]
cβ=0
c=[11]
t=cβ^σ^2c(XX)1c
tnrgraus de liberdade, onde é a matriz de design como acima, e que .X
σ^2=y(IPX)ynr
PX=X(XX)1X
Clarinetist
fonte

Respostas:

5

O teste pares combinados com pares é na verdade apenas um teste uma amostra com uma amostra do tamanho . Você tem diferenças e estas são iid e normalmente distribuídas. A primeira coluna após possuitntnnd1,,dn

[d1dn]=[d¯d¯]+[d1d¯d1d¯]n d.f.1 d.f.(n1) d.f.
=''1grau de liberdade devido à restrição linear que diz que todas as entradas são iguais; o segundo possui graus de liberdade devido à restrição linear que indica que a soma das entradas é .n10
Michael Hardy
fonte
Portanto, em outras palavras, a razão pela qual temos graus de liberdade aqui não tem nada a ver com o modelo linear ? n1y=Xβ+ϵ
Clarinetist
11
Ele não têm a ver com aquele modelo, em que a matriz é uma coluna de s e é um matriz cuja única entrada é a diferença entre os dois meios de população. X1β1×1
Michael Hardy
2
Aha! Então seu vetor seria aquele vetor de s, correto? Muito obrigado! Não acredito como tem sido difícil encontrar uma resposta para isso! ydi
Clarinetist
Sim. É o vetor de diferenças observadas nos pares correspondentes. n
Michael Hardy
2

Muito, muito obrigado a Michael Hardy por responder à minha pergunta.

A idéia é a seguinte: let e . Então nosso modelo linear é então que é o vetor de todos e Obviamente tem classificação , então temos graus de liberdade .

y=[d1dn]
β=[μ1μ2]
y=1n×1β+ϵ
1n×1n
ϵ=[ϵ1ϵn]N(0,σ2In).
X=1n×11n1

Como sabemos definir igual a ? Lembre-se de que e, como pode ser facilmente visto, para todos . Dado o nosso , é óbvio o que deve ser. Isto é porque β[μ1μ2]

E[y]=Xβ
E[dj]=μ1μ2jXβ
E[y]=E[[d1dn]]=[E[d1]E[dn]]=[μ1μ2μ1μ2]=Xβ=1n×1β=[11]β
so deve ser uma matriz com .β1×1β=[μ1μ2]

Defina . Então, nosso teste de hipótese é Nossa estatística de teste é, assim, Temos Após algum trabalho, pode ser mostrado que Também pode ser mostrado quec=[1]

H0:cβ=0.
cβ^σ^2c(XX)1c.
σ^2=y(IPX)ynr(X).
PX=P1n×1=1n×1(1n)1.
IPXé simétrico e idempotente. Então, e
σ^2=y(IPX)ynr(X)=y(IPX)(IPX)ynr(X)=(IPX)y2nr(X)=[I1n×1(1n)1]y2n1=[d1dn][d¯d¯]2n1=i=1n(did¯)2n1=sd2
XX=1n×11n×1=n
que obviamente possui inversa , fornecendo assim uma estatística de teste que seria testada em uma distribuição central com graus de liberdade conforme desejado.1/n
μ^1μ^2sd2/n
tn1
Clarinetist
fonte