Qual é a distribuição do máximo de um par de iid draws, onde o mínimo é uma estatística de ordem de outros mínimos?

Considere desenhos independentes do cdf , definido acima de 0-1, onde e são números inteiros. Agrupe arbitrariamente os sorteios em grupos com valores m em cada grupo. Veja o valor mínimo em cada grupo. Pegue o grupo que tem o maior desses mínimos. Agora, qual é a distribuição que define o valor máximo nesse grupo? De maneira mais geral, qual é a distribuição para a estatística de ésima ordem de draws de , onde a k-ésima ordem desses m também é a enésima ordem dos n-draws da estatística de k-ésima ordem? $n\cdot m$ $F(x)$ $n$ $m$ $n$ $j$ $m$ $F(x)$

Tudo isso é no máximo abstrato, então aqui está um exemplo mais concreto. Considere 8 empates de . Agrupe-os em 4 pares de 2. Compare o valor mínimo em cada par. Selecione o par com o maior destes 4 mínimos. Etiqueta que desenha "a". Rotule o outro valor nesse mesmo par como "b". Qual é a distribuição ? Nós sabemos . Sabemos que a é o máximo de 4 mínimos de , de . O que é ? $F(x)$ $F_b(b)$ $b>a$ $F(x)$ $F_a(a) = (1-(1-F(x))^2)^4$ $F_b(b)$

distributions probability extreme-value order-statistics OctaviaQ
fonte

posso perguntar onde você conseguiu esse problema?

Theta30

JandR você excluiu um comentário seu no qual indicou um método ad-hoc usando pesos.

Theta30

Sim, achei que agora era irrelevante, pois você forneceu uma solução muito melhor. Vou ver se consigo encontrar o que escrevi.

OctaviaQ

sim, mas pode haver algumas ideias interessantes

Theta30

Meu método de força bruta: imaginei que seria uma mistura de pesos previsíveis de estatísticas de ordem de n * m extraídos de F (x). Por exemplo, para e , que começa com oito independente chama a partir de F (x), e > a estatística de ordem 4. Para descobrir que o PR é cada uma das estatísticas de ordem 5-8, escrevi um script de computador que escrevia todas as permutações de 1 a 8 e um algoritmo que encontrava para cada permutação (usando as próprias estatísticas de ordem como comparações ) (cont ...)

X_{f i n a l}

$X_{final}$

n = 4

$n=4$

m = 2

$m=2$

X_{f i n a l}

$X_{final}$

X_{f i n a l}

$X_{final}$

OctaviaQ

Respostas:

Eu respondo: "Agrupe arbitrariamente os sorteios em n grupos com valores m em cada grupo. Observe o valor mínimo em cada grupo. Pegue o grupo que possui o maior desses mínimos. Agora, qual é a distribuição que define o valor máximo? nesse grupo? "
Seja a i-ésima variável aleatória no grupo j ( ) sua função de densidade (cdf). Seja o máximo e o mínimo no grupo . Deixe a variável que resulta no final de todo o processo. Queremos calcular que é $X_{i,j}$ $f(x_{i,j})$ $F(x_{i,j})$
$X_{\max,j}, X_{\min,j}$ $j$ $X_{final}$ $P(X_{final}<x)$

P (X_{max, j_{0}} < x and X_{min, j_{0}} = max_{j} X_{min, j} and 1 \leq j_{0} \leq n)

$P(X_{\max,j_0}<x \hbox{ and } X_{\min,j_0}=\max_j{X_{\min,j}} \hbox { and } 1\leq j_0\leq n)$

= n P (X_{m a x, 1} < x and X_{min, 1} = max_{j} X_{min, j})

$=nP(X_{max,1}<x \hbox{ and } X_{\min,1}=\max_j{X_{\min,j}})$

= n m P (X_{1, 1} < x and X_{1, 1} = max_{i} (X_{i, 1}) and X_{min, 1} = max_{j} X_{min, j})

$=nmP(X_{1,1}<x\hbox{ and } X_{1,1}=\max_i(X_{i,1})\hbox{ and } X_{\min,1}=\max_j{X_{\min,j}})$

= n m P (X_{1, 1} < x, X_{1, 1} > X_{2, 1} > max_{j = 2 \dots n} X_{m i n, j}, \dots, X_{1, 1} > X_{m, 1} > max_{j = 2 \dots n} X_{m i n, j})

$=nmP(X_{1,1}<x, X_{1,1}>X_{2,1}>\max_{j=2\ldots n} X_{min,j},\ldots,X_{1,1}>X_{m,1}>\max_{j=2\ldots n} X_{min,j})$ Agora, deixe e .

Y = max_{j = 2 \dots n} X_{m i n, j}

$Y=\max_{j=2\ldots n} X_{min,j}$

W = X_{1, 1}

$W=X_{1,1}$

Um lembrete: se são iid com pdf (cdf) ( ), então possui pdf e possui pdf . Usando isso, obtemos o pdf de é $X_1,\ldots X_n$ $h$ $H$ $X_{\min}$ $h_{\min}=nh(1-H)^{n-1}$ $X_{\max}$ $h_{max}=nhH^{n-1}$
$Y$

g (y) = (n - 1) m f (1 - F)^{m - 1} [\int_{0}^{y} m f (z) (1 - F (z))^{m - 1} d z]^{n - 2}, n \geq 2

$g(y)=(n-1)mf(1-F)^{m-1}[\int_0^y mf(z)(1-F(z))^{m-1} dz]^{n-2},n\geq 2$

Observe que é uma estatística independente do grupo 1, portanto sua densidade articular com qualquer variável do grupo 1 é o produto de densidades. Agora a probabilidade acima se torna ao tomar derivado deste wrt integrante e usando a fórmula binomial obtém-se a PDF de . $Y$

n m \int_{0}^{x} f (w) [\int_{0}^{w} \int_{y}^{w} f (x_{2, 1}) d x_{2, 1} \dots \int_{y}^{w} f (x_{m, 1}) d x_{m, 1} g (y) d y] d w

$nm\int_0^x f(w)[\int_0^w \int_y^w f(x_{2,1})dx_{2,1}\ldots\int_y^w f(x_{m,1})dx_{m,1}g(y)dy]dw$

= n m \int_{0}^{x} f (w) [\int_{0}^{w} (F (w) - F (y))^{m - 1} g (y) d y] d w

$=nm\int_0^x f(w)[\int_0^w (F(w)-F(y))^{m-1}g(y)dy]dw$

x

$x$

X_{f i n a l}

$X_{final}$

Exemplo: é uniforme, , . Então, $X$ $n=4$ $m=3$

g (y) = 9 (1 - y)^{2} (3 y + y^{3} - 3 y^{2})^{2},

$g(y)=9(1-y)^2(3y+y^3-3y^2)^2,$

P (X_{f i n a l} < x) = (1 / 55) x^{12} - (12 / 55) x^{11}

$P(X_{final}<x)=(1/55)x^{12}-(12/55)x^{11}$

+ (6 / 5) x^{10} - (27 / 7) x^{9} + (54 / 7) x^{8} - (324 / 35) x^{7} + (27 / 5) x^{6} .

$+ (6/5)x^{10}-(27/7)x^9+(54/7)x^8-(324/35)x^7+(27/5)x^6.$

A média de é e seu sd é . $X_{final}$ $374/455=0.822$ $0.145$

Theta30
fonte

Obrigado pela ajuda! Mas, quando sigo o processo exatamente para exemplos simples (como F (x) = x, n = 4, m = 2), o pdf resultante não se integra a 1 ou parece razoável. Então, não tenho certeza do que está errado. Além disso, não estou claro sobre o seu g (y). Eu pensei que precisaria de m's: hmin (y) = m * f (y) (1-F (y)) ^ (m-1)  g (y) = (n-1) * hmin (y) * [ Integral acima de 0 a x de hmin (y)] ^ (n-2) ou, mais simplesmente, G (y) = (1- (1-F (y)) ^ m) ^ (n-1), g ( y) = G '(y). Mas, mesmo que eu substitua por g (y), o pdf final ainda não faz sentido. Estou interpretando algo errado?

OctaviaQ

@JandR Eu verifiquei novamente hoje; veja as correções

Theta30

Para sua informação, eu originalmente postei essa pergunta no mathoverflow.net. Eu postou um link para a sua resposta aqui, mas se você estiver interessado em re-posting ou vincular sua resposta mesmo, a questão é aqui: ligação

OctaviaQ

Como os sorteios são de amostras de um IDI, podemos apenas considerar o sorteio selecionado. Considere . Agora sabemos que é de e que . Assim, $f(x) = \frac{d F(x)}{dx}$ $b$ $f(x)$ $b>a$

p (b | a) = \frac{f (b)}{\int_{a}^{1} f (y) d y} \forall b > a, 0 otherwise .

$p(b|a) = \frac{f(b)}{\int_a^1 f(y) dy} \forall b>a, 0 \text{ otherwise}.$

O mínimo em um empate de dois é $m$

p_{2} (m) = f (m) \int_{m}^{1} f (y) d y .

$p_2(m) = f(m)\int_m^1f(y) dy.$

O maior mínimo entre 4 empates seria

p (a) = p_{2} (a) {[\int_{0}^{a} p_{2} (z) d z]}^{3} = f (a) \int_{a}^{1} f (x) d x {[\int_{0}^{a} f (y) (\int_{y}^{1} f (z) d z) d y]}^{3} .

$p(a) = p_2(a)\left[\int_0^a p_2(z) dz\right]^3 = f(a)\int_a^1f(x) dx \left[\int_0^af(y)\left(\int_y^1f(z)dz\right) dy \right]^3.$

Então finalmente

p (b) = \int_{0}^{1} [u (a) \frac{f (b)}{\int_{a}^{1} f (y) d y} f (a) \int_{a}^{1} f (x) d x {[\int_{0}^{a} f (y) (\int_{y}^{1} f (z) d z) d y]}^{3}] d a .

$p(b) = \int_0^1 \left[u(a) \frac{f(b)}{\int_a^1 f(y)dy} f(a)\int_a^1f(x) dx \left[\int_0^af(y)\left(\int_y^1f(z)dz\right) dy \right]^3 \right] da.$

alta largura de banda
fonte

Obrigado pela elaboração. Estou tentando entender isso! Duas perguntas: O que é u (a) na última equação? e, você tem certeza que sua equação para p2 (m) está correta? É diferente (e apresenta uma resposta diferente) de todas as outras equações mínimas que já vi. Entre - eu realmente aprecio sua ajuda!

OctaviaQ

Esta resposta parece estar faltando alguns coeficientes binomiais .

whuber