Valor esperado de x em uma distribuição normal, Dado que está abaixo de um determinado valor

12

Basta saber se é possível encontrar o valor esperado de x se ele é normalmente distribuído, dado que está abaixo de um determinado valor (por exemplo, abaixo do valor médio).

Jasmim
fonte
É claro que é possível. No mínimo, você pode calcular pela força bruta F(t)1xtf(t)dt . Ou, se você conhece μ e σ pode estimar usando uma simulação.
dsaxton
@dsaxton Existem alguns erros de digitação nessa fórmula, mas entendemos a ideia. O que estou curioso é como exatamente você executaria a simulação quando o limite estiver muito abaixo da média.
whuber
1
@whuber Sim, F(t) deve ser F(x) . Não seria muito inteligente fazer uma simulação quando F(x) estiver próximo de zero, mas como você apontou, existe uma fórmula exata de qualquer maneira.
dsaxton
@dsaxton OK, é justo. Eu só esperava que você tivesse em mente algum tipo de idéia inteligente e simples para simular a partir de uma distribuição normal.
whuber
Mais ou menos a mesma pergunta em Math.SE: math.stackexchange.com/questions/749664/average-iq-of-mensa
Jik

Respostas:

18

Uma variável normalmente distribuída com μ média e variância σ 2 tem a mesma distribuição que σ Z + μ, onde Z é uma variável normal padrão. Tudo o que você precisa saber sobre Z é queXμσ2σZ+μZZ

  • sua função de distribuição cumulativa é chamada ,Φ
  • tem uma função de densidade de probabilidade e queϕ(z)=Φ(z)
  • .ϕ(z)=zϕ(z)

As duas primeiras balas são apenas notação e definições: a terceira é a única propriedade especial das distribuições normais que precisaremos.

Deixe o "certo valor" ser . Antecipando a mudança de X para Z , definaTXZ

t=(Tμ)/σ,

de modo a

Pr(XT)=Pr(Zt)=Φ(t).

Então, começando com a definição da expectativa condicional, podemos explorar sua linearidade para obter

E(X|XT)=E(σZ+μ|Zt)=σE(Z|Zt)+μE(1|Zt)=(σtzϕ(z)dz+μtϕ(z)dz)/Pr(Zt)=(σtϕ(z)dz+μtΦ(z)dz)/Φ(t).

O teorema fundamental do Cálculo afirma que qualquer integrante de um derivado é encontrado através da avaliação da função nos pontos finais: . Isso se aplica a ambas as integrais. Como ambos Φ e ϕ devem desaparecer em - , obtemosabF(z)dz=F(b)F(a)Φϕ

E(X|XT)=μσϕ(t)Φ(t).

É a média original menos um termo de correção proporcional à relação Invers Mills .

! [figura: gráfico da relação inversa de Mills

Como seria de esperar, a razão inversa de Mills para deve ser positiva e exceder - t (cujo gráfico é mostrado com uma linha vermelha pontilhada). Ele deve diminuir para 0 à medida que t cresce, pois o truncamento em Z = t (ou X = T ) não muda quase nada. Como t cresce muito negativo, a razão inversa de Mills deve se aproximar - t porque as caudas da distribuição normal diminuem tão rapidamente que quase toda a probabilidade na cauda esquerda está concentrada perto do seu lado direito (em t ).tt0tZ=tX=Tttt

Finalmente, quando está na média, t = 0, onde a razão inversa de moinhos é igual a T=μt=0. Isso implica que o valor esperado deX, truncado em sua média (que é o negativo de umadistribuição semi-normal), é-2/π0.797885X vezes seu desvio padrão abaixo da média original.2/π

whuber
fonte
6

Em geral, deixe ter a função de distribuição F ( X ) .XF(X)

Temos, para , P ( X x | c 1X c 2 )x[c1,c2] Você pode obter casos especiais considerando, por exemplo,c1=-, que produzF(c1)=0.

P(Xx|c1Xc2)=P(Xxc1Xc2)P(c1Xc2)=P(c1Xx)P(c1Xc2)=F(x)F(c1)F(c2)F(c1)
c1=F(c1)=0

Usando cdfs condicionais, você pode obter densidades condicionais (por exemplo, para X N ( 0 , 1 ) ), que podem ser usadas para expectativas condicionais.f(x|X<0)=2ϕ(x)XN(0,1)

E(X|X<0)=20xϕ(x)=2ϕ(0),
Christoph Hanck
fonte
+1 (de alguma forma, eu perdi isso quando apareceu pela primeira vez). A primeira parte é um excelente relato de como obter funções de distribuição truncadas e a segunda mostra como calcular seus PDFs.
whuber