Qual é a diferença entre e ?

18

Geralmente, qual é a diferença entre e ? $E(X|Y)$ $E(X|Y=y)$

Ex é função de e último é função de ? É tão confuso .. $y$ $x$

conditional-expectation notation definition 신범준
fonte

Hmmm ... O último não deve ser uma função de x, mas um número! Estou errado?

David

23

Grosso modo, a diferença entre e é que a primeira é uma variável aleatória, enquanto a segunda é (em algum sentido) uma realização de . Por exemplo, se então é a variável aleatória Por outro lado, uma vez que é observado, provavelmente estaríamos interessados na quantidade que é um escalar. $E(X \mid Y)$ $E(X \mid Y = y)$ $E(X \mid Y)$

(X, Y) \sim N (0, (\begin{matrix} 1 & ρ \\ ρ & 1 \end{matrix}))

$(X, Y) \sim \mathcal N\left(\mathbf 0, \begin{pmatrix} 1 & \rho \\ \rho & 1 \end{pmatrix}\right)$

E (X ∣ Y)

$E(X \mid Y)$

E (X ∣ Y) = ρ Y .

$E(X \mid Y) = \rho Y.$

Y = y

$Y = y$

E (X ∣ Y = y) = ρ y

$E(X \mid Y = y) = \rho y$

Talvez isso pareça uma complicação desnecessária, mas considerar como uma variável aleatória por si só é o que faz coisas como a lei da torre fazer sentido - a coisa no interior do aparelho é aleatória, então podemos perguntar qual é a sua expectativa, enquanto não há nada aleatório em . Na maioria dos casos, podemos esperar calcular $E(X \mid Y)$ $E(X) = E[E(X \mid Y)]$ $E(X \mid Y = y)$

E (X ∣ Y = y) = \int x f_{X ∣ Y} (x ∣ y) d x

$E(X \mid Y = y) = \int x f_{X\mid Y}(x \mid y) \ dx$

e, em seguida, obtenha "conectando" a variável aleatória no lugar de na expressão resultante. Como sugerido em um comentário anterior, há um pouco de sutileza que pode surgir com relação a como essas coisas são rigorosamente definidas e vinculá-las da maneira apropriada. Isso tende a acontecer com probabilidade condicional, devido a alguns problemas técnicos da teoria subjacente. $E(X \mid Y)$ $Y$ $y$

cara
fonte

8

Suponha que e são variáveis aleatórias. $X$ $Y$

Seja um número real fixo , diga . Então, é um número : é o valor condicional esperado de dado que tem o valor . Agora, observe algum outro número real fixo , diga , seria o valor esperado condicional de dado (um valor real número). Não há razão para supor que $y_0$ $y_0 = 1$ $E[X\mid Y=y_0]= E[X\mid Y = 1]$ $X$ $Y$ $1$ $y_1$ $y_1=1.5$ $E[X\mid Y = y_1] = E[X\mid Y = 1.5]$ $X$ $Y = 1.5$ $E[X\mid Y = 1.5]$ e $E[X\mid Y = 1]$ têm o mesmo valor. Assim, também podemos considerar $E[X\mid Y=y]$ como sendo umafunção com valor real que mapeia números reaispara números reais. Observe que a afirmação na pergunta do OP de queé uma função de está incorreta:é uma função com valor real de $g(y)$ $y$ $E[X\mid Y = y]$ $E[X\mid Y = y]$ $x$ $E[X\mid Y = y]$ $y$ .

Por outro lado, $E[X\mid Y]$ é uma variável aleatória $Z$ que passa a ser uma função da variável aleatória $Y$ . Agora, sempre que escrevemos $Z = h(Y)$ , o que queremos dizer é que sempre que a variável aleatória $Y$ tem valor $y$ , a variável aleatória $Z$ tem valor $h(y)$ . Sempre que $Y$ assume o valor $y$ , a variável aleatória $Z = E[X\mid Y]$ assume o valor $E[X\mid Y = y] = g(y)$ . Assim, $E[X\mid Y]$ é apenas outro nome para a variável aleatória $Z = g(Y)$ . Observe que $E[X\mid Y]$ é uma função de $Y$ (não $y$ como na declaração da pergunta do OP).

Como um exemplo ilustrativo simples, suponha que $X$ e $Y$ sejam variáveis aleatórias discretas com distribuição conjunta

\begin{aligned} P (X = 0, Y = 0) & = 0.1, P (X = 0, Y = 1) = 0.2, \\ P (X = 1, Y = 0) & = 0.3, P (X = 1, Y = 1) = 0.4. \end{aligned}

$\begin{align} P(X=0,Y=0) &= 0.1,~~ P(X=0, Y=1) = 0.2,\\ P(X=1,Y=0) &= 0.3,~~ P(X=1,Y=1) = 0.4. \end{align}$ Observe que

X

$X$ e

Y

$Y$ sãovariáveis aleatórias(dependentes) deBernoullicom parâmetros

0.7

$0.7$ e

0.6

$0.6$ respectivamente, e então

E [X] = 0.7

$E[X] = 0.7$ e

E [Y] = 0.6

$E[Y] = 0.6$ . Agora, observe que,condicionadoem

Y = 0

$Y=0$ ,

X

$X$ é uma variável aleatória de Bernoulli com parâmetro

0.75

$0.75$ enquanto condicionada em

Y = 1

$Y = 1$ ,

X

$X$ é uma variável aleatória de Bernoulli com parâmetro

\frac{2}{3}

$\frac 23$ . Se você não consegue entender por que isso é tão imediato, apenas elabore os detalhes: por exemplo,

P (X = 1 ∣ Y = 0) = \frac{P (X = 1, Y = 0)}{P (Y = 0)} = \frac{0.3}{0.4} = \frac{3}{4}, P (X = 0 ∣ Y = 0) = \frac{P (X = 0, Y = 0)}{P (Y = 0)} = \frac{0.1}{0.4} = \frac{1}{4},

$P(X=1\mid Y = 0) = \frac{P(X=1, Y=0)}{P(Y=0)} = \frac{0.3}{0.4} = \frac 34,\\ P(X=0\mid Y = 0) = \frac{P(X=0, Y=0)}{P(Y=0)} = \frac{0.1}{0.4} = \frac 14,$ e de forma semelhante para

P (X = 1 ∣ Y = 1)

$P(X=1\mid Y=1)$ e

P (X = 0 ∣ Y = 1)

$P(X=0\mid Y = 1)$ . Portanto, temos que

E [X ∣ Y = 0] = \frac{3}{4}, E [X ∣ Y = 1] = \frac{2}{3} .

$E[X\mid Y = 0] = \frac 34, \quad E[X \mid Y = 1] = \frac 23.$ Assim,

E [X ∣ Y = y] = g (y)

$E[X\mid Y = y] = g(y)$ que

g (y)

$g(y)$ é uma função com valor real, desfrutando das propriedades:

g (0) = \frac{3}{4}, g (1) = \frac{2}{3} .

$g(0) = \frac 34, \quad g(1) = \frac 23.$

Por outro lado, $E[X\mid Y] = g(Y)$ é uma variável aleatória que assume os valores $\frac 34$ e $\frac 23$ com probabilidades $0.4 = P(Y=0)$ e $0.6 = P(Y=1)$ respectivamente. Observe que $E[X\mid Y]$ é umavariável aleatóriadiscreta, masnão éuma variável aleatória de Bernoulli.

Como toque final, observe que

E [Z] = E [E [X ∣ Y]] = E [g (Y)] = 0.4 \times \frac{3}{4} + 0.6 \times \frac{2}{3} = 0.7 = E [X] .

$E[Z] = E\left[E[X\mid Y]\right] = E[g(Y)] = 0.4\times \frac 34 + 0.6\times \frac 23 = 0.7 = E[X].$ Ou seja, o valor esperado dessafunçãode

Y

$Y$ , calculado usando apenas a distribuição marginal de

Y

$Y$ , passa a ter omesmovalor numérico que

E [X]

$E[X]$ !! Esta é uma ilustração de um resultado mais geral que muitas pessoas acreditam que é uma mentira:

E [E [X ∣ Y]] = E [X] .

$E\left[E[X\mid Y]\right] = E[X].$

Desculpe, isso é apenas uma pequena piada. MENTIRA é um acrônimo para Lei da Expectativa Iterada, que é um resultado perfeitamente válido que todos acreditam ser a verdade.

Dilip Sarwate
fonte

3

é a expectativa de uma variável aleatória: a expectativa de condicional em . , por outro lado, é um valor específico: o valor esperado de quando . $E(X|Y)$ $X$ $Y$ $E(X|Y=y)$ $X$ $Y=y$

Pense desta maneira: deixe representar a ingestão calórica e representar a altura. é então a ingestão calórica, condicionada à altura - e, neste caso, representa nosso melhor palpite quanto à ingestão calórica ( ) quando uma pessoa tem uma certa altura digamos, 180 centímetros. $X$ $Y$ $E(X|Y)$ $E(X|Y=y)$ $X$ $Y = y$

abaumann
fonte

4

Acredito que sua primeira frase deve substituir "distribuição" por "expectativa" (duas vezes).

Glen_b -Reinstala Monica 10/10

4

não é a distribuição de

dado

; isso seria mais comumente denotado pela densidade condicional

ou função de distribuição condicional.

é a expectativa condicional de

dado

, que é umavariável aleatória mensurável em

E (X ∣ Y)

$E(X\mid Y)$

X

$X$

Y

$Y$

f_{X ∣ Y} (x ∣ y)

$f_{X \mid Y} (x \mid y)$

E (X ∣ Y)

$E(X \mid Y)$

X

$X$

Y

$Y$

Y

$Y$

E (X ∣ Y = y)

$E(X \mid Y = y)$ pode ser pensado como a realização da variável aleatória

quando

é observado (mas existe a possibilidade da sutileza da teoria da medida se infiltrar).

E (X ∣ Y)

$E(X \mid Y)$

Y = y

$Y = y$

cara

1

@guy Sua explicação é a primeira resposta precisa já fornecida (das três oferecidas até o momento). Você consideraria publicá-lo como resposta?

whuber

@whuber eu iria, mas eu não tenho certeza de como encontrar o equilíbrio entre precisão e fazer a resposta adequada útil OP e eu sou paranóico sobre se tropeçar em tecnicalidades :)

cara

@ Buy Acho que você já fez um bom trabalho com os detalhes técnicos. Como você é sensível a se comunicar bem com o OP (o que é ótimo!), Considere oferecer um exemplo simples para ilustrar - talvez apenas uma distribuição conjunta com marginais binários.

whuber

1

é o valor esperado de valores de dados valores de é o valor esperado de dado que o valor de é $E(X|Y)$ $X$ $Y$ $E(X|Y=y)$ $X$ $Y$ $y$

Geralmente é a probabilidade dos valores dados valores , mas você pode ser mais preciso e dizer , ou seja, probabilidade do valor de todos os 's, dada a 'th valor de 's. A diferença é que, no primeiro caso, trata-se de "valores de" e no segundo você considera um determinado valor. $P(X|Y)$ $X$ $Y$ $P(X=x|Y=y)$ $x$ $X$ $y$ $Y$

Você pode encontrar o diagrama abaixo útil.

Diagrama do teorema de Bayes

Tim
fonte

Esta resposta discute probabilidade, enquanto a pergunta pergunta sobre expectativa. Qual é a conexão?

whuber

Qual é a diferença entre e ?

Respostas: