Suponha o seguinte modelo de regressão bivariado:
que é iid para .
yi=βxi+ui,
uiN(0,σ2=9)i=1,…,n
Suponha que um anterior não informativo , então seja possível mostrar que o pdf posterior para é
ondep ( β) ∝ constanteβ β =(Σ n i = 1 yixi)/(Σ n i = 1 x 2 i ).
p ( β| y )=(18π)- 12( ∑i = 1nx2Eu)12exp[ - 118∑i = 1nx2Eu( β- β^)2] ,
β^= ( ∑ni = 1yEuxEu) / ( ∑ni = 1x2Eu) .
Agora considere o valor de com um determinado valor futuro de , :
que é iid , então podemos mostrar que
é uma densidade normal com expectativa e variação
Portanto, a função de densidade de probabilidade posterior para , condicional em , é
x x n + 1 y n + 1 = β x n + 1 + u n + 1 , u n + 1 N ( 0 , σ 2 = 9 ) p ( y n + 1 | x n + 1 , y ) = ∫ β p ( y n + 1 | x nyxxn + 1
yn + 1= βxn + 1+ un + 1,
vocên + 1N( 0 , σ2= 9 )p ( yn + 1| xn + 1, y ) = ∫βp ( yn + 1| xn + 1, β, y ) p ( β| y )dβ
E[ yn + 1| xn + 1, y ] = β^xn + 1,v a r [ yn + 1| xn + 1, y ] = 9 [ x2n + 1+ ∑ni = 1x2Eu]∑ni = 1x2Eu.
yn + 1xn + 1p ( yn + 1| xn + 1, y ) =⎛⎝⎜⎜⎜⎜⎜18 π[ x2n + 1+ ∑i = 1nx2Eu]∑i = 1nx2Eu⎞⎠⎟⎟⎟⎟⎟- 12× exp⎧⎩⎨⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪- ∑i = 1nx2Eu18 ( x2n + 1+ ∑i = 1nx2Eu)( yn + 1- β^xn + 1)2⎫⎭⎬⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪
Agora a pergunta é: especifique um intervalo de previsão de 95% para e interprete-o com cuidado. De que aspectos do processo de geração de dados o intervalo falha para acomodar nossa incerteza?yn + 1
Não tenho muita certeza de como responder à pergunta, mas aqui está minha tentativa:
Então, essencialmente, precisamos encontrar alguns e modo queumabP( a < yn + 1< b ) = ∫bumap ( yn + 1| xn + 1, y ) dyn + 1= 95 %
Agora sabemos que onde e ; Portanto,
yn + 1| xn + 1, y ∼ N( m , v2)m = E[ yn + 1| xn + 1, Y ]v2= v a r [ yn + 1| xn + 1, Y ]
yn + 1- mv∼ N( 0 , 1 )
P( - 1,96 < yn + 1- mv< 1,96 ) = 95 %
P( - 1,96 v + m < yn + 1< 1,96 v + m ) = 95 %
Agora, porque estamos condicionando e observando a expressão para e , vemos que e são valores conhecidos. Assim, podemos tomar e . ou seja, podemos selecionar muitas outras possibilidades de e , que deu uma probabilidade de ... mas como isso se relaciona com responder a parte da pergunta que pergunta o que aspectos do processo de geração de dados neste intervalo não consegue acomodar? v m v m a = - 1,96 v + m b = 1,96 v + m a b 95 %xn + 1vmvma = - 1,96 v + mb = 1,96 v + mumab95 %
Respostas:
O intervalo acomoda toda a incerteza no problema. Na descrição do problema, as únicas coisas que você não conhece são e . O intervalo de previsão que você derivou acomoda a incerteza em ambos. Portanto, não resta incerteza para o intervalo "falhar em acomodar".uβ u
fonte