Distribuição amostral de duas populações independentes de Bernoulli

17

Vamos supor que temos amostras de duas variáveis ​​aleatórias independentes de Bernoulli, e .B e r ( θ 2 )Ber(θ1)Ber(θ2)

Como provamos que ?

(X¯1-X¯2)-(θ1-θ2)θ1(1-θ1)n1+θ2(1-θ2)n2dN(0 0,1)

Suponha que .n1n2

Um velho no mar.
fonte
Z_i = X_1i - X_2i é uma sequência do iid rv de média e variância finitas. Portanto, ele satisfaz o teorema do limite central de Levy-Linderberg, do qual seus resultados se seguem. Ou você está pedindo uma prova da própria clt?
Diagrama de três Diag
@ThreeDiag Como você está aplicando a versão LL do CLT? Eu não acho isso correto. Escreva uma resposta para eu verificar os detalhes.
Um velho no mar.
Todos os detalhes já estão lá. Para a LL se aplicar, você precisa de uma sequência de iid rv com média e variância finitas. A variável Z_i = X_i1 e X_i2 atende a todos os três requisitos. Independência segue desde a independência dos dois bernoulli originais Vars e você pode ver que E (Z_i) e V (Z_i) são finitos, aplicando propriedades padrão de E e V
Três Diag
1
"amostras de duas variáveis ​​aleatórias independentes de Bernoulli" - expressão incorreta. Deve ser: "duas amostras independentes das distribuições de Bernoulli".
Viktor
1
Por favor, adicione "como ". n1,n2
Viktor

Respostas:

10

Coloque ,b=uma=θ1(1-θ1)n1 , A=(ˉX1-θ1)/a, B=(ˉX2-θ2)/b. Temos AdN(0,1),BdN(0,1). Em termos de funções características, significa ϕA(t)Eeb=θ2(1-θ2)n2UMA=(X¯1-θ1)/umaB=(X¯2-θ2)/bUMAdN(0 0,1), BdN(0 0,1) Queremos provar que D:= a

ϕUMA(t)EeEutUMAe-t2/2, ϕB(t)e-t2/2.
D: =umauma2+b2UMA-buma2+b2BdN(0 0,1)

Como e B são independentes, ϕ D ( t ) = ϕ A ( aUMAB como queremos que ele seja.

ϕD(t)=ϕUMA(umauma2+b2t)ϕB(-buma2+b2t)e-t2/2,

Esta prova está incompleta. Aqui precisamos de algumas estimativas para convergência uniforme de funções características. No entanto, no caso em consideração, podemos fazer cálculos explícitos. Coloque . ϕ X 1 , 1 ( t )p=θ1, m=n1 comot3m-3/20. Assim, para umtfixo, ϕD(t)=(1-a2t2

ϕX1,1(t)=1+p(eit1),ϕX¯1(t)=(1+p(eit/m1))m,ϕX¯1θ1(t)=(1+p(eit/m1))meipt,ϕA(t)=(1+p(eit/mp(1p)1))meiptm/p(1p)=((1+p(eit/mp(1p)1))eipt/mp(1p))m=(1t22m+O(t3m3/2))m
t3m3/20t (mesmo seum0oub0), uma vez que| e-y-(1-y/m)m| y2/2m
ϕD(t)=(1a2t22(a2+b2)n1+O(n13/2))n1(1b2t22(a2+b2)n2+O(n23/2))n2et2/2
a0b0|ey(1y/m)m|y2/2m quando y / m < 1 / 2 (ver /math/2566469/uniform-bounds-for-1-y-nn-exp-y/ ). y/m<1/2

Observe que cálculos semelhantes podem ser feitos para distribuições arbitrárias (não necessariamente Bernoulli) com segundos momentos finitos, usando a expansão da função característica em termos dos dois primeiros momentos.

Viktor
fonte
Isso parece correto. Voltarei a você mais tarde, quando tiver tempo para verificar tudo. ;)
Um velho no mar.
-1

Provar sua declaração é equivalente a provar o Teorema do Limite Central (Levy-Lindenberg), que declara

{ZEu}Eu=1nE(ZEu)=μV(ZEu)=σ2

n(Z¯-μ)dN(0 0,σ2)

Z¯=EuZEu/n

Então é fácil ver que, se colocarmos

ZEu=X1Eu-X2Eu
X1Eu,X2EuBer(θ1)Ber(θ2)

E(ZEu)=θ1-θ2=μ

e

V(ZEu)=θ1(1-θ1)+θ2(1-θ2)=σ2

n1n2

Three Diag
fonte
n1n2
Mostrarei mais tarde se você não conseguir. Dica: calcular a variação da média da amostra de Z e da utilização que como a variável no teorema
Três Diag
n1n2
Fará assim que encontrar um pouco de timr. De fato, havia uma sutileza que impede o uso de LL clt sem ajuste. Existem três maneiras de seguir, a mais simples delas é invocar o fato de que para n1 e n2 grandes, X1 e X2 vão na distribuição para normais, então uma combinação linear de normal também é normal. Esta é uma propriedade dos normais que você pode tomar como dado, caso contrário, você pode prová-lo por funções características.
Three Diag
Os outros dois requerem um clt diferente (Lyapunov possivelmente) ou tratam alternativamente n1 = ie n2 = i + k. Então, para grande i você pode essencialmente desrespeito k e você pode voltar a aplicar LL (mas ainda vai exigir alguns cuidados para unhas a variância direita)
Três Diag