Teste Qui-quadrado de duas amostras

10

Esta pergunta é do livro de Van der Vaart Asymptotic Statistics, pág. 253. # 3:

Suponha que e sejam vetores multinomiais independentes com parâmetros e . Sob a hipótese nula de que mostra queXmYn(m,a1,,ak)(n,b1,,bk)ai=bi

i=1k(Xm,imc^i)2mc^i+i=1k(Yn,inc^i)2nc^i
possui . onde .c i = ( X m , i + Y n , i ) / ( m + n )χk12c^i=(Xm,i+Yn,i)/(m+n)

Preciso de ajuda para começar. Qual é a estratégia aqui? Consegui combinar os dois summands em:

i=1k(mYn,inXm,i)2mn(m+n)c^i

mas isso não funciona com o CLT porque é uma combinação ponderada de e . Não tenho certeza se este é o caminho certo. Alguma sugestão?Y nXmYn

EDIT: se então é muito fácil, porque temosm=n

mYnnXmmn(m+n)=YnXm(m+n)

onde o numerador pode ser visto como uma soma das diferenças das variáveis ​​Multinomiais para que possamos aplicar o CLT e finalizá-lo com o Teorema 17.2 do mesmo capítulo. No entanto, não consigo descobrir como fazer isso funcionar nessa situação com diferentes tamanhos de amostra. Qualquer ajuda?(1,a1,,ak)

Um link para o capítulo 17 do van der Vaart, do Google Livros

bdeonovic
fonte

Respostas:

6

Primeiro alguma notação. Let e denotam a sequência categórica associada a e , ou seja, . Seja . Considere as binerizações where é o delta de Kronecker. Então nós temos{ Y t } 1 , , n X m Y nPr { X t =i } =ai,Pr { Y t =i } =biN=n+m X Eu{Xt}1,,m{Yt}1,,nXmYnPr{Xt=i}=ai,Pr{Yt=i}=biN=n+m δi,j1i=jXm,i= N t = 1 Xt ,

Xi=(X1,i,,XN,i)=(δi,X1,,δi,Xn,0,,0)Yi=(Y1,i,,YN,i)=(0,,0,δi,Y1,,δi,Yn)
δi,j1i=j
Xm,i=t=1NXt,i=t=1mδi,XtYn,i=t=1NYt,i=t=1nδi,Yt

Agora começamos a prova. Primeiro, combinamos os dois summands da estatística de teste. Observe que Para que possamos escrever a estatística do teste como

Xm,imc^i=(n+m)Xm,im(Xm,i+Yn,i)n+m=nXm,imYn,in+mYn,inc^i=(n+m)Yn,in(Xm,i+Yn,i)n+m=mYn,inXm,in+m
S=i=1k(Xm,imc^i)2mc^i+i=1k(Yn,inc^i)2nc^i=i=1k(nXm,imYn,i)2(n+m)2mc^i+i=1k(nXm,imYn,i)2(n+m)2nc^i=i=1k(nXm,imYn,i)2nm(n+m)c^i

Observe que com o seguintes propriedades

nXm,imYn,i=t=1NnXt,imYt,i=Zi
E[Zi]=nE[Xm,i]mE[Yn,i]=nmainmai=0Var[Zi]=Var[nXm,imYn,i]=n2Var[Xm,i]m2Var[Yn,i]Note Xm,i and Yn,i are independent=n2mai(1ai)+m2nai(1ai)=nm(n+m)ai(1ai)Cov[Zi,Zj]=E[ZiZj]E[Zi]E[Zj]=E[(nXm,imYn,i)(nXm,jmYn,j)]=n2(maiaj+m2aiaj)2n2m2aiaj+m2(naiaj+n2aiaj)=nm(n+m)aiaj

e assim, por CLT multivariado, temos onde o elemento , . Como Por Slutsky, temos que é a matriz de identidade ,

1nm(n+m)Z=nXmmYnnm(n+m)DN(0,Σ)
(i,j)Σσij=ai(δijaj)c^=(c^1,,c^k)p(a1,,ak)=a
nXmmYnnm(n+m)c^DN(0,Ikaa)
Ikk×ka=(a1,,ak) . Como tem o autovalor 0 da multiplicidade 1 e o autovalor 1 da multiplicidade , pelo teorema do mapeamento contínuo (ou consulte Lema 17.1, Teorema 17.2 de van der Vaart), temosk-1 k i=1(n X m , i -m Y n , i ) 2Ikaak1
i=1k(nXm,imYn,i)2nm(n+m)c^iDχk12
bdeonovic
fonte