Interpretação do intervalo de previsão bayesiano de 95%

9

Suponha o seguinte modelo de regressão bivariado: que é iid para .

yi=βxi+ui,
uiN(0,σ2=9)i=1,,n

Suponha que um anterior não informativo , então seja possível mostrar que o pdf posterior para é ondep(β)constantβ β =(Σ n i = 1 yixi)/(Σ n i = 1 x 2 i ).

p(β|y)=(18π)12(i=1nxi2)12exp[118i=1nxi2(ββ^)2],
β^=(i=1nyixi)/(i=1nxi2).

Agora considere o valor de com um determinado valor futuro de , : que é iid , então podemos mostrar que é uma densidade normal com expectativa e variação Portanto, a função de densidade de probabilidade posterior para , condicional em , é x x n + 1 y n + 1 = β x n + 1 + u n + 1 , u n + 1 N ( 0 , σ 2 = 9 ) p ( y n + 1 | x n + 1 , y ) = β p ( y n + 1 | x nyxxn+1

yn+1=βxn+1+un+1,
un+1N(0,σ2=9)
p(yn+1|xn+1,y)=βp(yn+1|xn+1,β,y)p(β|y)dβ
E[yn+1|xn+1,y]=β^xn+1,var[yn+1|xn+1,y]=9[xn+12+i=1nxi2]i=1nxi2.
yn+1xn+1
p(yn+1|xn+1,y)=(18π[xn+12+i=1nxi2]i=1nxi2)12×exp{i=1nxi218(xn+12+i=1nxi2)(yn+1β^xn+1)2}

Agora a pergunta é: especifique um intervalo de previsão de 95% para e interprete-o com cuidado. De que aspectos do processo de geração de dados o intervalo falha para acomodar nossa incerteza?yn+1


Não tenho muita certeza de como responder à pergunta, mas aqui está minha tentativa:

Então, essencialmente, precisamos encontrar alguns e modo queabP(a<yn+1<b)=abp(yn+1|xn+1,y)dyn+1=95%

Agora sabemos que onde e ; Portanto, yn+1|xn+1,yN(m,v2)m=E[yn+1|xn+1,y]v2=var[yn+1|xn+1,y]

yn+1mvN(0,1)
P(1.96<yn+1mv<1.96)=95%
P(1.96v+m<yn+1<1.96v+m)=95%

Agora, porque estamos condicionando e observando a expressão para e , vemos que e são valores conhecidos. Assim, podemos tomar e . ou seja, podemos selecionar muitas outras possibilidades de e , que deu uma probabilidade de ... mas como isso se relaciona com responder a parte da pergunta que pergunta o que aspectos do processo de geração de dados neste intervalo não consegue acomodar? v m v m a = - 1,96 v + m b = 1,96 v + m a b 95 %xn+1vmvma=1.96v+mb=1.96v+mab95%

TeTs
fonte
1
Por favor, adicione a tag auto-estudo se for um dever de casa ou uma tentativa de um problema de livro didático.
Nick Cox
2
@ Nick Cox Obrigado por me informar, eu adicionei a etiqueta de auto-estudo.
TeTs
Será que o intervalo especificamente não nos dá nenhum entendimento sobre a forma do processo de geração de dados? Ou seja, não sabemos a combinação de média / variância apenas a partir do intervalo?
Pergunta estranha. Existe um contexto anterior ao exercício? Por que você diz um modelo de regressão bivariado ?
Stéphane Laurent

Respostas:

2

O intervalo acomoda toda a incerteza no problema. Na descrição do problema, as únicas coisas que você não conhece são e . O intervalo de previsão que você derivou acomoda a incerteza em ambos. Portanto, não resta incerteza para o intervalo "falhar em acomodar".uβu

Tom Minka
fonte
Ainda há incerteza quanto ao fato de o modelo estar ou não correto.
Xi'an
1
O modelo foi declarado como uma suposição. Portanto, não há incerteza sobre isso.
Tom Minka
Suponho que o que se quer dizer é que a distribuição preditiva representa toda a incerteza no problema e o intervalo resume apenas algum aspecto dessa distribuição. Ainda assim, não está claro que, como intervalo, deixe algo de fora.
conjugateprior