Quantos dos maiores termos em

11

Considere onde X 1 , , X N são iid e o CLT mantém. Quantos dos maiores termos somam metade da soma total? Por exemplo, 10 + 9 + 8 (10 + 9 + 8 + 1) / 2: 30% dos termos atingem cerca da metade do total.i=1N|Xi|X1,,XN

Definir
sumbiggest( j;X1XN)sum of the j biggest of |X1||XN|
halfsum(N)the smallest j such that sumbiggest( j )sumbiggest(N)/2.

Existe um resultado assintótico geral para halfsum ( )? Uma derivação simples e intuitiva seria legal.N,μ,σ

(Um pouco de Monte Carlo sugere que às vezes halfsum ( ) N / 4 ou assim; isto é, a maior 1/4 do X i . Adicionar até 1/2 do total Recebo 0,24 N para halfnormal, 0,19 N para exponencial, para N = 20, 50, 100.)NN
Xi
NNN

denis
fonte
3
Não espere um resultado universal semelhante ao CLT. Por exemplo, a resposta para variáveis ​​uniformes (0,1) será muito diferente da resposta para variáveis ​​uniformes (1000,1001)!
whuber
Certo, o halfsum dependerá da média e do sd. Mas por que ~ N / 5 para exponencial?
Denis #
2
Assintoticamente, Denis, o ponto de corte para a halfsum será o valor de para o qual x 0 t f ( t ) d t = 1 / 2 onde f é a pdf para | X i | ; a pergunta pede N ( 1 - F ( x ) ) ( F é o cdf para | X i | ). No caso do uniforme [ 0 , 1 ]x0xtf(t)dt=1/2f|Xi|N(1F(x))F|Xi|[0,1]distribuição você recebe a resposta de @ Dilip; por um exponencial, . x0.186682NN/5
whuber

Respostas:

2

Não, não há um resultado assintótico geral. Vamos ser o ordenou x i , onde x [ 1 ] é o maior.x[1]x[N]xix[1]

Considere os dois exemplos a seguir:

1) . Claramente, o CLT é válido. Você só precisa de observação M = 1 para M j = 1 | x [ j ] | 1P(x=0)=1M=1. j=1M|x[j]|12N|xi|

P(x=1)=1M=N/2j=1M|x[j]|12N|xi|

Para um exemplo não trivial, a distribuição de Bernoulli:

P(x=1)=p, P(x=0)=1ppN/2p

jbowman
fonte
4
0N/2x[i]
1

Xi[0,1]iXiN/2N/2XN/4NNU[0,1]01x0<x<1(1x)Nx1(1+x)/2(1x)N(1+x)/2)=(1x2)N/2N/4x1/2(11/2)N0.3NN/4

iXi=YYx(1x2)N/2=Y/2YN/2N/12Yx=1(Y/N)YY=0Y=N

Dilip Sarwate
fonte
(0,1)1(0,)Y1,Y2,,Yn+1Ymax=α Y(1),Y(2),,Y(n)(0,α)
De qualquer forma, meu argumento não usa as distâncias entre as amostras ordenadas da distribuição uniforme.
Dilip Sarwate
Você está certo, eu te entendi mal. Como uma questão paralela, as partes entre pontos aleatórios uniformes não são distribuídas exponencialmente, após o dimensionamento - o inverso do seu q + a? [Regra quebrada do Projeto de Demonstrações Wolfram] ( demonstrations.wolfram.com/BrokenStickRule ) com certeza parece exponencial, deve ser fácil? prova.
Denis #
Faça sua pergunta paralela como uma pergunta separada.
Dilip Sarwate
Começou, então viu a distribuição de probabilidade dos comprimentos de fragmentos , você pode comentar lá.
Denis #
0

Vamos supor que X tenha apenas valores positivos para se livrar do valor absoluto.

Sem uma prova exata, acho que você tem que resolver k

(1FX(k))E(X|X>=k)=12E(X)

n(1FX(k))

Minha lógica é que, assimetricamente, a soma de todos os valores maiores que k deve ser de aproximadamente

n(1FX(k))E(X|X>=k)

e assimtopicamente metade da soma total é de cerca de

12nE(X)

[0,1]F(k)=kk=(12)

Erik
fonte