Suponha que uma variável aleatória tenha um limite inferior e um superior [0,1]. Como calcular a variação de uma variável?
22
Suponha que uma variável aleatória tenha um limite inferior e um superior [0,1]. Como calcular a variação de uma variável?
Respostas:
Você pode provar a desigualdade de Popoviciu da seguinte maneira. Utilizar a notação e . Defina uma função por Calculando a derivada e resolvendo descobrimos que atinge seu mínimo em ( note que ).m=infX M=supX g g(t)=E[(X−t)2]. g′ g′(t)=−2E[X]+2t=0, g t=E[X] g′′>0
Agora, considere o valor da função no ponto especial . Deve ser o caso em que Mas Como e , temos implicando queg t=M+m2 Var[X]=g(E[X])≤g(M+m2). g(M+m2)=E[(X−M+m2)2]=14E[((X−m)+(X−M))2]. X−m≥0 X−M≤0 ((X−m)+(X−M))2≤((X−m)−(X−M))2=(M−m)2, 14E[((X−m)+(X−M))2]≤14E[((X−m)−(X−M))2]=(M−m)24. V a r [ X ] ≤ ( M - m ) 2
Portanto, provamos a desigualdade de Popoviciu
Var[X]≤(M−m)24.
fonte
Seja uma distribuição em . Vamos mostrar que, se a variância de é máxima, então pode ter nenhum apoio no interior, do qual resulta que é Bernoulli eo resto é trivial.[ 0 , 1 ] F F FF [0,1] F F F
Por uma questão de notação, seja o ésimo momento bruto de (e, como sempre, escrevemos e para a variância).k F μ = μ 1 σ 2 = μ 2 - μ doisμk=∫10xkdF(x) k F μ=μ1 σ2=μ2−μ2
Sabemos que não tem todo o seu suporte em um ponto (a variação é mínima nesse caso). Entre outras coisas, isso implica que fica estritamente entre e . Para argumentar por contradição, suponha que exista algum subconjunto mensurável no interior para o qual . Sem qualquer perda de generalidade, podemos assumir (alterando para se necessário) que : em outras palavras, é obtido cortando qualquer parte de acima da média eμ 0 1 I ( 0 , 1 ) F ( I ) > 0 X 1 - X F ( J = I ∩ ( 0 , μ ] ) > 0 J I JF μ 0 1 I (0,1) F(I)>0 X 1−X F(J=I∩(0,μ])>0 J I J tem probabilidade positiva.
Vamos alterar para retirando toda a probabilidade de e colocando-a em . F ′ J 0F F′ J 0 Ao fazer isso, muda paraμk
Por uma questão de notação, vamos escrever para tais integrais, de onde[g(x)]=∫Jg(x)dF(x)
Calcular
O segundo termo do lado direito, , é não-negativo, porque em toda a parte em . O primeiro termo à direita pode ser reescritoμ ≥ x J(μ[x]−[x]2) μ≥x J
O primeiro termo à direita é estritamente positivo porque (a) e (b) porque assumimos que não está concentrado em um ponto. O segundo termo não é negativo porque pode ser reescrito como e esse integrando não é negativo das suposições em e . Segue que .[ 1 ] = F ( J ) < 1 F [ ( μ - x ) ( x ) ] μ ≥ x J 0 ≤ x ≤ 1 σ ′ 2 - σ 2 > 0μ>0 [1]=F(J)<1 F [(μ−x)(x)] μ≥x J 0≤x≤1 σ′2−σ2>0
Acabamos de mostrar que, de acordo com nossas premissas, alterar para aumenta estritamente sua variação. A única maneira que esta não pode acontecer, em seguida, é, quando toda a probabilidade de é concentrado nos pontos finais e , com (digamos) valoriza e , respectivamente. Sua variância é facilmente calculada para igual a que é máxima quando e é igual a lá.F ' F ' 0 1 1 - p p p ( 1 - P ) p = 1 / 2 1 / 4F F′ F′ 0 1 1−p p p(1−p) p=1/2 1/4
Agora, quando é uma distribuição em , mais recente e redimensionamos para uma distribuição em . O recente não altera a variação, enquanto o redimensionamento a divide por . Assim, um com variação máxima em corresponde à distribuição com variação máxima em : portanto, é uma distribuição de Bernoulli redimensionada e traduzida para com variação 2/4 , QED .[ a , b ] [ 0 , 1 ] ( b - a ) 2 F [ a , b ] [ 0 , 1 ] ( 1 / 2 )F [a,b] [0,1] (b−a)2 F [a,b] [0,1] (1/2) ( b - a ) 2 / 4[a,b] (b−a)2/4
fonte
Se a variável aleatória é restrita a e sabemos a média , a variação é limitada por .μ = E [ X ] ( b - μ ) ( μ - a )[a,b] μ=E[X] (b−μ)(μ−a)
Vamos primeiro considerar o caso . Observe que para todos , , portanto também . Usando este resultado, x ∈ [ 0 , 1 ] x 2 ≤ x E [ X 2 ] ≤ E [ X ] σ 2 = E [ X 2 ] - ( E [ X ] 2 ) = E [ X 2 ] - μ 2 ≤ μ - μ 2 = μ (a=0,b=1 x∈[0,1] x2≤x E[X2]≤E[X]
Para generalizar para os intervalos com , considere restrito a . Defina , que é restrito em . Equivalentemente, e, portanto, onde a desigualdade é baseada no primeiro resultado. Agora, substituindo , o limite é igual a que é o resultado desejado.b > a Y [ a , b ] X = Y - a[a,b] b>a Y [a,b] X=Y−ab−a Y = ( b - a ) X + a V a r [ Y ] = ( b - a ) 2 V a r [ X ] ≤ ( b - a ) 2 μ X ( 1 - μ X ) . μ X = μ Y - a[0,1] Y=(b−a)X+a
fonte
A pedido do @ user603 ....
Um limite superior útil da variância de uma variável aleatória que assume valores em com probabilidade é . Uma prova para o caso especial (que é o que o OP perguntou) pode ser encontrada aqui em math.SE , e é facilmente adaptada ao caso mais geral. Como observado na minha comentário acima e também na resposta aqui referenciado, uma variável aleatória discreta que assume valores e com igual probabilidade tem variância e, portanto, nenhum limite geral mais restrito pode ser encontrado. [ a , b ] 1 σ 2 ≤ ( b - a ) 2σ2 [a,b] 1 a=0,b=1ab1σ2≤(b−a)24 a=0,b=1 a b (b-a)212 (b−a)24
Outro ponto a ser lembrado é que uma variável aleatória limitada tem variação finita, enquanto que para uma variável aleatória ilimitada, a variação pode não ser finita e, em alguns casos, pode até não ser definível. Por exemplo, a média não pode ser definida para variáveis aleatórias de Cauchy e, portanto, não é possível definir a variação (como a expectativa do desvio ao quadrado da média).
fonte
você tem certeza de que isso é verdade em geral - para distribuições contínuas e discretas? Você pode fornecer um link para as outras páginas? Para uma distribuição geral de , é trivial mostrar que Eu posso imaginar que existem desigualdades mais acentuadas ... Você precisa do fator para o seu resultado?V a r ( X ) = E [ ( X - E [ X ] ) 2 ] ≤ E [ ( b - a ) 2 ] = ( b - a ) 2 . 1 / 4[a,b]
Por outro lado, pode-se encontrá-lo com o fator sob o nome Popoviciu's_inequality na wikipedia.1/4
Este artigo parece melhor do que o artigo da Wikipedia ...
Para uma distribuição uniforme, sustenta que
fonte