Estatísticas suficientes em conjunto: uniforme (a, b)

12

Seja uma amostra aleatória da distribuição uniforme em , onde . Seja e as estatísticas de pedidos maiores e menores. Mostre que a estatística é uma estatística suficiente em conjunto para o parâmetro . X=(x1,x2,xn)(a,b)a<bY1Yn(Y1,Yn)θ=(a,b)

Não é problema para mim mostrar suficiência usando a fatoração.

Pergunta: Como mostro integridade? De preferência, gostaria de uma dica.

Tentativa: Eu posso mostrar implica para a distribuição uniforme de um parâmetro, mas estou ficando preso na distribuição uniforme de dois parâmetros.E[g(T(x))]=0g(T(x))=0

Tentei brincar com e usar a distribuição conjunta de e , mas não tenho certeza se estou indo na direção correta, pois o cálculo está me excitando.Y 1 Y nE[g(Y1,Yn)]Y1Yn

emlu
fonte
1
Por favor, adicione a [self-study]tag e leia seu wiki . Observe que você pode usar a formatação de látex para matemática colocando dólares ao redor, por exemplo, $x$produz x . Tentei digitar algumas de suas contas, mas sinta-se à vontade para mudar ou reverter se você não estiver satisfeito com o resultado. Você pode preferir a notação $\vec x$para x vez de $\mathbf x$para x .
Silverfish

Respostas:

4

Vamos cuidar do cálculo de rotina para você, para que você possa chegar ao cerne do problema e aproveitar a formulação de uma solução. Tudo se resume a construir retângulos como uniões e diferenças de triângulos.

Primeiro, escolha valores de a e b que fazem os detalhes mais simples possível. Gosto de a=0,b=1 : a densidade univariada de qualquer componente de X=(X1,X2,,Xn) é apenas a função indicadora do intervalo [0,1] .

Vamos encontrar a função de distribuição F de (Y1,Yn) . Por definição, para qualquer número real y1yn isso é

(1)F(y1,yn)=Pr(Y1y1 and Ynyn).

Os valores de são obviamente 0 ou 1 , caso algum de y 1 ou y n esteja fora do intervalo [ a , b ] = [ 0 , 1 ] , então vamos assumir que ambos estão nesse intervalo. (Vamos também assumir n 2 para evitar discutir trivialidades.) Nesse caso, o evento ( 1 ) pode ser descrito em termos das variáveis ​​originais X = ( X 1 , X 2 , F01y1yn[a,b]=[0,1]n2(1) como "pelo menos um dos X i é menor ou igual a y 1 e nenhum dos X i excede y n ". Equivalentemente, todos os X i estão em [ 0 , y n ], mas não é o caso em que todos eles se encontram ( y 1 , y n ] . X=(X1,X2,,Xn)Xiy1XiynXi[0,yn](y1,yn]

Because the Xi are independent, their probabilities multiply and give (yn0)n=ynn and (yny1)n, respectively, for these two events just mentioned. Thus,

F(y1,yn)=ynn(yny1)n.

The density f is the mixed partial derivative of F,

f(y1,yn)=2Fy1yn(y1,yn)=n(n1)(yny1)n2.

The general case for (a,b) scales the variables by the factor ba and shifts the location by a. Thus, for a<y1yn<b,

F(y1,yn;a,b)=((ynaba)n(ynabay1aba)n)=(yna)n(yny1)n(ba)n.

Differentiating as before we obtain

f(y1,yn;a,b)=n(n1)(ba)n(yny1)n2.

Consider the definition of completeness. Let g be any measurable function of two real variables. By definition,

(2)E[g(Y1,Yn)]=y1babg(y1,yn)f(y1,yn)dy1dyny1babg(y1,yn)(yny1)n2dy1dyn.

We need to show that when this expectation is zero for all (a,b), then it's certain that g=0 for any (a,b).

Here's your hint. Let h:R2R be any measurable function. I would like to express it in the form suggested by (2) as h(x,y)=g(x,y)(yx)n2. To do that, obviously we must divide h by (yx)n2. Unfortunately, for n>2 this isn't defined whenever yx. The key is that this set has measure zero so we can neglect it.

Accordingly, given any measurable h, define

g(x,y)={h(x,y)/(yx)n2xy0x=y

Then (2) becomes

(3)y1babh(y1,yn)dy1dynE[g(Y1,Yn)].

(When the task is showing that something is zero, we may ignore nonzero constants of proportionality. Here, I have dropped n(n1)/(ba)n2 from the left hand side.)

This is an integral over a right triangle with hypotenuse extending from (a,a) to (b,b) and vertex at (a,b). Let's denote such a triangle Δ(a,b).

Ergo, what you need to show is that if the integral of an arbitrary measurable function h over all triangles Δ(a,b) is zero, then for any a<b, h(x,y)=0 (almost surely) for all (x,y)Δ(a,b).

Although it might seem we haven't gotten any further, consider any rectangle [u1,u2]×[v1,v2] wholly contained in the half-plane y>x. It can be expressed in terms of triangles:

[u1,u2]×[v1,v2]=Δ(u1,v2)(Δ(u1,v1)Δ(u2,v2))Δ(u2,v1).

Figure showing the three triangles overlapping to produce the rectangle

In this figure, the rectangle is what is left over from the big triangle when we remove the overlapping red and green triangles (which double counts their brown intersection) and then replace their intersection.

Consequently, you may immediately deduce that the integral of h over all such rectangles is zero. It remains only to show that h(x,y) must be zero (apart from its values on some set of measure zero) whenever y>x. The proof of this (intuitively clear) assertion depends on what approach you want to take to the definition of integration.

whuber
fonte
I tried to set equation 3 equal to zero, take the derivative on both sides and interchange the signs (a reflex action I guess) but the results look quite scary [1]. Is there a more reasonable approach? [1] en.wikipedia.org/wiki/Leibniz_integral_rule#Higher_dimensions
mugen
1
Consider finite collections of smaller and smaller triangles all lying along the hypotenuse in the picture and take the limit as the diameter of the largest triangle in the collection goes to zero.
whuber