Função inversa de variância

9

Para um dado número constante (por exemplo, 4), é possível encontrar uma distribuição de probabilidade para , de modo que tenhamos ?rXVar(X)=r

amiref
fonte
11
Não, a menos que você tenha informações extras.
Hemant Rupani
@ Hemant Rupani que informações extras são necessárias?
Amiref 02/07
11
qualquer natureza da variável aleatória 'X'…
Hemant Rupani
3
Sugiro que você edite sua pergunta para substituir "valor para X" por "distribuição para X" - se X tiver apenas um único valor, X terá uma distribuição degenerada e terá variação zero.
Silverfish
11
A menos que seja negativo, a resposta é obviamente sim, uma variação pode ser qualquer número positivo. r
dsaxton

Respostas:

13

Considerando cuidadosamente os casos para : se , a distribuição é degenerada, mas pode ter alguma média. Ou seja, e \ Pr (X = c) = 0 para qualquer c \ neq \ mu . Portanto, podemos encontrar muitas distribuições possíveis para o X , mas elas são indexadas e completamente especificadas por \ mu \ in \ mathbb {R} .rr=0XPr(X=μ)=1Pr(X=c)=0 0cμXμR

Se , nenhuma distribuição poderá ser encontrada, pois .V a r ( X ) = E ( X - μ X ) 20r<0 0Vumar(X)=E(X-μX)20 0

Para , a resposta vai depender do que informações adicionais se sabe sobre . Por exemplo, se é conhecida por ter médios , seguida por quaisquer e podemos encontrar uma distribuição com estes momentos, tomando . Esta não é uma solução única para o problema de combinar média e variância, mas é a única solução normalmente distribuída (e de todas as soluções possíveis, é a que maximiza a entropia, como Daniel aponta). Se você também quisesse corresponder, por exemplo, ao terceiro momento central , ou superior, seria necessário considerar uma gama mais ampla de distribuições de probabilidade.X X μ μ R r > 0 X ~ N ( μ , r )r>0 0XXμμRr>0 0XN(μ,r)

Suponhamos que tivéssemos algumas informações sobre a distribuição de vez de seus momentos. Por exemplo, se soubermos que segue uma distribuição Poisson, a solução única seria . Se sabemos que segue uma distribuição exponencial, novamente existe uma solução exclusiva , onde encontramos o parâmetro resolvendo .X X ~ P o i s s o n ( r ) X X ~ E x p o n e n t i a l ( 1XXXPoEusson(r)XVar(X)=r=1XExponentEuumaeu(1 1r)Vumar(X)=r=1 1λ2

Em outros casos, podemos encontrar uma família inteira de soluções. Se sabemos que segue uma distribuição retangular (uniforme uniforme), podemos encontrar uma largura única para a distribuição resolvendo . Mas haverá toda uma família de soluções, parametrizadas por - as distribuições neste conjunto são todas traduções de uma para a outra. Da mesma forma, se é normal, qualquer distribuição funcionaria (portanto, temos todo um conjunto de soluções indexadas por , que novamente pode ser qualquer número real e, novamente, a família é toda tradução de cada um). E sew V a r ( X ) = r = w 2XW XU(a,a+w)aRXXN(μ,r)μXXGamma(rVumar(X)=r=W212XU(a,a+w)umaRXXN(μ,r)μX segue uma distribuição gama; em seguida, usando a parametrização da escala de formas, podemos obter toda uma família de soluções, parametrizada por . Os membros desta família não são traduções um do outro. Para ajudar a visualizar como uma "família de soluções" pode parecer, aqui estão alguns exemplos de distribuições normais indexadas por e depois distribuições gama indexadas por , todas com variação igual a quatro, correspondendo ao exemplo em sua pergunta.θ>0μθr=4XGumammuma(rθ2,θ)θ>0 0μθr=4

Distribuições normais com variância quatro Distribuições gama com variação quatro

Por outro lado, para algumas distribuições, pode ou não ser possível encontrar uma solução, dependendo do valor de . Por exemplo, se deve ser uma variável de Bernoulli, então para existem duas soluções possíveis porque existem duas probabilidades que resolvem a equação , e de fato essas duas probabilidades são complementares, isto é, . Para existe apenas a solução única , e para distribuição de Bernoulli não apresenta variação suficientemente alta.X 0 r < 0,25 X ~ B e r n o u l l i ( p ) p V um r ( X ) = r = p ( 1 - P ) p 1 + p 2 = 1 r = 0,25 p = 0,5 r > 0,25rX0 0r<0,25XBernovocêeueuEu(p)pVar(X)=r=p(1p)p1+p2=1r=0.25p=0.5r>0.25

Acho que também devo mencionar o caso . Também existem soluções para este caso, por exemplo, uma distribuição de Student com dois graus de liberdade.tr=t

Código R para parcelas

require(ggplot2)

x.df  <- data.frame(x = rep(seq(from=-8, to=8, length=100), times=5),
    mu = rep(c(-4, -2, 0, 2, 4), each=100))
x.df$pdf <- dnorm(mean=x.df$mu, x.df$x)
ggplot(x.df, aes(x=x, y=pdf, group=factor(mu), colour=factor(mu))) + theme_bw() + 
    geom_line(size=1) + scale_colour_brewer(name=expression(mu), palette="Set1") +
    theme(legend.key = element_blank()) + ggtitle("Normal distributions with variance 4")

x.df  <- data.frame(x = rep(seq(from=0, to=20, length=1000), times=5),
    theta = rep(c(0.25, 0.5, 1, 2, 4), each=1000))
x.df$pdf <- dgamma(x.df$x, shape=4/(x.df$theta)^2, scale=x.df$theta)
ggplot(x.df, aes(x=x, y=pdf, group=factor(theta), colour=factor(theta))) + theme_bw() + 
    geom_line(size=1) + scale_colour_brewer(name=expression(theta), palette="Set1") +
    theme(legend.key = element_blank()) + ggtitle("Gamma distributions with variance 4") +
    coord_cartesian(ylim = c(0, 1)) 
Silverfish
fonte
17

Supondo que você queira dizer "é possível encontrar uma distribuição de probabilidade para ", a resposta é sim, pois você não especificou nenhum critério que deva satisfazer. De fato, há um número infinito de distribuições possíveis que satisfariam essa condição. Apenas considere uma distribuição Normal, . Você pode definir e pode assumir qualquer valor que você gosta - você terá, então, , conforme necessário.X N ( x ; μ , σ 2 ) σ 2 = r μ V a r [ X ] = rXXN(x;μ,σ2)σ2=rμVumar[X]=r

De fato, a distribuição Normal é bastante especial nesse sentido, pois é a distribuição de probabilidade máxima de entropia para uma determinada média e variância.

Daniel
fonte
você está certo, eu o corrigi. você poderia explicar mais?
Amiref 02/07
@AmirEf O que não está claro?
Daniel
6
Não está claro o que mais Daniel deveria explicar; a resposta aqui parece lidar com tudo na sua pergunta postada.
Glen_b -Reinstala Monica
15

Essa questão pode ser interpretada de uma maneira que a torne interessante e não inteiramente trivial. Dado algo que se parece com uma variável aleatória, até que ponto é possível atribuir probabilidades a seus valores (ou mudar as probabilidades existentes) de tal maneira que sua variação seja igual a algum número pré-especificado ? A resposta é que todos os valores possíveis são permitidas, até um limite determinado pela gama de .r r 0 XXrr0X

O interesse potencial em uma análise desse tipo reside na idéia de alterar uma medida de probabilidade, mantendo uma variável aleatória fixa, a fim de alcançar um fim específico. Embora essa aplicação seja simples, ela exibe algumas das idéias subjacentes ao teorema de Girsanov , um resultado fundamental nas finanças matemáticas.


Vamos reafirmar esta questão de maneira rigorosa e inequívoca. Suponha

X:(Ω,S)R

é uma função mensurável definida em um espaço de medida com sigma-algebra . Para um determinado número real , quando é possível encontrar uma medida de probabilidade neste espaço para o qual ?S r > 0 P Var ( X ) = rΩSr>0PVar(X)=r

Acredito que a resposta é que isso é possível quando . sup(X)inf(X)>2r Xsup(X)=inf(X)=-r (A igualdade pode valer se o supremo e o mínimo forem ambos alcançados: ou seja, eles realmente são o máximo e o mínimo de ) Quando ou , essa condição não impõe limite em e, em seguida, todos os valores não negativos da variação são possíveis.Xsup(X)=inf(X)=r

A prova é por construção. Vamos começar com uma versão simples, para cuidar dos detalhes e definir a idéia básica, e depois prosseguir para a construção real.

  1. Seja na imagem de : isso significa que existe um para o qual . Defina a função definida para ser o indicador de : ou seja, se e quando .X ω xohms X ( ω x ) = x P : S[ 0 , 1 ] ω x P ( A ) = 0 ω xUm P ( A ) = 1 ω xUmxXωxΩX(ωx)=xP:S[0,1]ωxP(A)=0ωxAP(A)=1ωxA

    Como , obviamente satisfaz os dois primeiros axiomas de probabilidade . É necessário mostrar que satisfaz o terceiro; ou seja, que é aditivo ao sigma. Mas isso é quase tão óbvio: sempre que é um conjunto finito ou infinitamente contável de eventos mutuamente exclusivos, então nenhum deles contém - nesse caso para todos os - ou exatamente um deles contém ; nesse caso, para um determinado e, caso contrário, para todos osP { E i , i = 1 , 2 , } ω x P ( E i ) = 0 i ω x P ( E j ) = 1 j P ( E i ) = 0 i jP(Ω)=1P{Ei,i=1,2,}ωxP(Ei)=0iωxP(Ej)=1jP(Ei)=0ij. Em ambos os casos

    P(iEi)=iP(Ei)

    porque ambos os lados são ou ambos .101

    Desde concentra toda a probabilidade em , a distribuição de é concentrada em e devem ter zero variância.ω x X x XPωxXxX

  2. Seja dois valores no intervalo de ; isto é, e . De maneira semelhante à etapa anterior, defina uma medida como uma média ponderada dos indicadores de e . Usar pesos não-negativos e para a ser determinado. Assim como antes, descobrimos que sendo uma combinação convexa das medidas indicadoras discutidas em (1) - é uma medida de probabilidade. A distribuição de em relação a esta medida é uma Bernoulli X X ( ω 1 ) = x 1 X ( ω 2 ) = x 2 P ωx1x2XX(ω1)=x1X(ω2)=x2Pω1 1 - p p p P X ( p ) x 2 - x 1 - x 1 ( p ) p ( 1 - p ) X ( x 2 - x 1ω21pppPX(p)distribuição que foi dimensionada por e deslocada por . Como a variação de uma distribuição de Bernoulli é , a variação de deve ser .x2x1x1(p)p(1p)X(x2x1)2p(1p)

Uma conseqüência imediata de (2) é que qualquer para o qual exista no intervalo de e para o qualx 1x 2 X 0 p < 1rx1x2X0p<1

r=(x2x1)2p(1p)

pode ser a variância de . Como , isso implica0 p ( 1 - P ) 1 / 4X0p(1p)1/4

2r=4rrp(1p)=(x2x1)2=x2x1sup(X)inf(X),

com igualdade mantendo se e somente se tiver um máximo e um mínimo.X

Por outro lado, se exceder esse limite de , nenhuma solução será possível, pois já sabemos que a variação de qualquer variável aleatória limitada não pode exceder um quarto da quadrado do seu alcance.( sup ( X ) - inf ( X ) ) 2 / 4r(sup(X)inf(X))2/4

whuber
fonte
3
Cara, acho que você está em um nível totalmente diferente do OP.
Mark L. Stone
4
@ Mark Provavelmente. (Eu acho que você detectou um cheiro de humor muito seco aqui.) Mas qualquer pessoa que aplique a tag de estatísticas matemáticas em seu post deve esperar esse tipo de coisa :-).
whuber
2
Isso me lembra quando eu assisti a uma aula de 4 alunos do falecido Prof Samuel Karlin (de Karlin e Taylor, entre outras coisas) em "Total Positivity". De alguma forma, o tópico da teoria dos jogos surgiu. Ele disse, oh, teoria dos jogos. Você tem duas medidas sigma-finitas não-negativas .... Agora, imagine-o introduzindo a teoria dos jogos dessa maneira para os alunos de uma aula de economia de calouros em uma faculdade de artes liberais. Foi nisso que sua postagem me fez pensar.
Mark L. Stone
@ Mark Compreendido. Não se faria isso e teria sucesso. Como você aponta, estou escrevendo aqui para (um subconjunto de) leitores gerais, e não para um específico. Por outro lado, o assunto abstrato não é difícil (neste nível elementar) e provou ser acessível a alunos de graduação motivados em faculdades de artes liberais. Veja os comentários em stats.stackexchange.com/a/94876, por exemplo.
whuber
4
As respostas do @ MarkL.Stone são mais do que apenas as perguntas imediatas (o SE pretende ser um repositório de boas perguntas e boas respostas valiosas para pessoas posteriores com perguntas semelhantes), e temos respostas para a visão mais elementar da pergunta aqui já . Alguns outros leitores podem obter algo da abordagem menos elementar das coisas; portanto, uma variedade de estilos e níveis de resposta torna a pergunta útil para mais pessoas.
Glen_b -Reinstar Monica
10

Sim, é possível encontrar essa distribuição. De fato, você pode obter qualquer distribuição com uma variação finita e escalar para corresponder à sua condição, porque

Var[cX]=c2Var[X]

Por exemplo, uma distribuição uniforme no intervalo tem variação: σ 2 = 1[0,1] Portanto, uma distribuição uniforme no intervalo[0,1

σ2=112
terá variânciar.[0,112r]r

De fato, essa é uma maneira comum de adicionar parâmetros a algumas distribuições, como o Student t. Possui apenas um parâmetro, - graus de liberdade. Quando ν a distribuição converge para um padrão normal. É em forma de sino e parece muito com o normal, mas tem caudas mais gordas. É por isso que é frequentemente usado como uma alternativa a uma distribuição normal quando as caudas são gordas. O único problema é que a distribuição gaussiana tem dois parâmetros. Então, vem a versão em escala do Student t, que às vezes é chamada de distribuição " t location scale" . Essa é uma transformação muito simples: ξ = t - μνν , ondeμ,ssão localização e escala. Agora, você pode definir a escala para que a nova variávelξtenha qualquer variação necessária e tenha uma forma de distribuição t de Student.ξ=tμsμ,sξ

Aksakal
fonte