Qual é a distribuição do máximo de um par de iid draws, onde o mínimo é uma estatística de ordem de outros mínimos?

8

Considere desenhos independentes do cdf , definido acima de 0-1, onde e são números inteiros. Agrupe arbitrariamente os sorteios em grupos com valores m em cada grupo. Veja o valor mínimo em cada grupo. Pegue o grupo que tem o maior desses mínimos. Agora, qual é a distribuição que define o valor máximo nesse grupo? De maneira mais geral, qual é a distribuição para a estatística de ésima ordem de draws de , onde a k-ésima ordem desses m também é a enésima ordem dos n-draws da estatística de k-ésima ordem?nmF(x)nmnjmF(x)

Tudo isso é no máximo abstrato, então aqui está um exemplo mais concreto. Considere 8 empates de . Agrupe-os em 4 pares de 2. Compare o valor mínimo em cada par. Selecione o par com o maior destes 4 mínimos. Etiqueta que desenha "a". Rotule o outro valor nesse mesmo par como "b". Qual é a distribuição ? Nós sabemos . Sabemos que a é o máximo de 4 mínimos de , de . O que é ?F(x)Fb(b)b>aF(x)Fa(a)=(1(1F(x))2)4Fb(b)

OctaviaQ
fonte
posso perguntar onde você conseguiu esse problema?
Theta30
JandR você excluiu um comentário seu no qual indicou um método ad-hoc usando pesos.
Theta30
Sim, achei que agora era irrelevante, pois você forneceu uma solução muito melhor. Vou ver se consigo encontrar o que escrevi.
OctaviaQ
sim, mas pode haver algumas ideias interessantes
Theta30
Meu método de força bruta: imaginei que seria uma mistura de pesos previsíveis de estatísticas de ordem de n * m extraídos de F (x). Por exemplo, para e , que começa com oito independente chama a partir de F (x), e > a estatística de ordem 4. Para descobrir que o PR é cada uma das estatísticas de ordem 5-8, escrevi um script de computador que escrevia todas as permutações de 1 a 8 e um algoritmo que encontrava para cada permutação (usando as próprias estatísticas de ordem como comparações ) (cont ...)Xfinaln=4m=2XfinalXfinal
OctaviaQ

Respostas:

4

Eu respondo: "Agrupe arbitrariamente os sorteios em n grupos com valores m em cada grupo. Observe o valor mínimo em cada grupo. Pegue o grupo que possui o maior desses mínimos. Agora, qual é a distribuição que define o valor máximo? nesse grupo? "
Seja a i-ésima variável aleatória no grupo j ( ) sua função de densidade (cdf). Seja o máximo e o mínimo no grupo . Deixe a variável que resulta no final de todo o processo. Queremos calcular que éXi,jf(xi,j)F(xi,j)
Xmax,j,Xmin,jjXfinalP(Xfinal<x)

P(Xmax,j0<x and Xmin,j0=maxjXmin,j and 1j0n)
=nP(Xmax,1<x and Xmin,1=maxjXmin,j)
=nmP(X1,1<x and X1,1=maxi(Xi,1) and Xmin,1=maxjXmin,j)
=nmP(X1,1<x,X1,1>X2,1>maxj=2nXmin,j,,X1,1>Xm,1>maxj=2nXmin,j)
Agora, deixe e . Y=maxj=2nXmin,jW=X1,1

Um lembrete: se são iid com pdf (cdf) ( ), então possui pdf e possui pdf . Usando isso, obtemos o pdf de é X1,XnhHXminhmin=nh(1H)n1Xmaxhmax=nhHn1
Y

g(y)=(n1)mf(1F)m1[0ymf(z)(1F(z))m1dz]n2,n2

Observe que é uma estatística independente do grupo 1, portanto sua densidade articular com qualquer variável do grupo 1 é o produto de densidades. Agora a probabilidade acima se torna ao tomar derivado deste wrt integrante e usando a fórmula binomial obtém-se a PDF de . Y

nm0xf(w)[0wywf(x2,1)dx2,1ywf(xm,1)dxm,1g(y)dy]dw
=nm0xf(w)[0w(F(w)F(y))m1g(y)dy]dw
xXfinal

Exemplo: é uniforme, , . Então,Xn=4m=3

g(y)=9(1y)2(3y+y33y2)2,

P(Xfinal<x)=(1/55)x12(12/55)x11
+(6/5)x10(27/7)x9+(54/7)x8(324/35)x7+(27/5)x6.

A média de é e seu sd é .Xfinal374/455=0.8220.145

Theta30
fonte
Obrigado pela ajuda! Mas, quando sigo o processo exatamente para exemplos simples (como F (x) = x, n = 4, m = 2), o pdf resultante não se integra a 1 ou parece razoável. Então, não tenho certeza do que está errado. Além disso, não estou claro sobre o seu g (y). Eu pensei que precisaria de m's: hmin (y) = m * f (y) (1-F (y)) ^ (m-1)  g (y) = (n-1) * hmin (y) * [ Integral acima de 0 a x de hmin (y)] ^ (n-2) ou, mais simplesmente, G (y) = (1- (1-F (y)) ^ m) ^ (n-1), g ( y) = G '(y). Mas, mesmo que eu substitua por g (y), o pdf final ainda não faz sentido. Estou interpretando algo errado?
OctaviaQ
@JandR Eu verifiquei novamente hoje; veja as correções
Theta30
Para sua informação, eu originalmente postei essa pergunta no mathoverflow.net. Eu postou um link para a sua resposta aqui, mas se você estiver interessado em re-posting ou vincular sua resposta mesmo, a questão é aqui: ligação
OctaviaQ
1

Como os sorteios são de amostras de um IDI, podemos apenas considerar o sorteio selecionado. Considere . Agora sabemos que é de e que . Assim,f(x)=dF(x)dxbf(x)b>a

p(b|a)=f(b)a1f(y)dyb>a,0 otherwise.

O mínimo em um empate de dois é m

p2(m)=f(m)m1f(y)dy.

O maior mínimo entre 4 empates seria

p(a)=p2(a)[0ap2(z)dz]3=f(a)a1f(x)dx[0af(y)(y1f(z)dz)dy]3.

Então finalmente

p(b)=01[u(a)f(b)a1f(y)dyf(a)a1f(x)dx[0af(y)(y1f(z)dz)dy]3]da.
alta largura de banda
fonte
Obrigado pela elaboração. Estou tentando entender isso! Duas perguntas: O que é u (a) na última equação? e, você tem certeza que sua equação para p2 (m) está correta? É diferente (e apresenta uma resposta diferente) de todas as outras equações mínimas que já vi. Entre - eu realmente aprecio sua ajuda!
OctaviaQ
Esta resposta parece estar faltando alguns coeficientes binomiais .
whuber