1. O problema
Eu tenho algumas medidas de uma variável , onde , para a qual eu tenho uma distribuição obtida via MCMC, que por simplicidade assumirei ser um gaussiano de média e variância \ sigma_t ^ 2 .ytt=1,2,..,nfyt(yt)μtσ2t
Eu tenho um modelo físico para essas observações, digamos g(t) , mas os resíduos rt=μt−g(t) parecem estar correlacionados; em particular, tenho razões físicas para pensar que um processo de AR(1) será suficiente para levar em consideração a correlação e planejo obter os coeficientes do ajuste via MCMC, para os quais preciso da probabilidade . Acho que a solução é bastante simples, mas não tenho muita certeza (parece tão simples que acho que estou perdendo alguma coisa).
2. Derivando a probabilidade
Um processo com média zero pode ser escrito como:
em que assumirei . Os parâmetros a serem estimados são, portanto, (no meu caso, também tenho que adicionar os parâmetros do modelo , mas esse não é o problema). O que observo, no entanto, é a variável
em que estou assumindo e são conhecidos (o erros de medição). Como é um processo gaussiano, também é. Em particular, eu sei que
X t = ϕ X t - 1 + ε t , ( 1 ) ε t ∼ N ( 0 , σ 2 w ) θ = { ϕ , σ 2 w } g ( t ) R t = X t + η t , ( 2 ) η t ∼ N (AR(1)
Xt=ϕXt−1+εt, (1)
εt∼N(0,σ2w)θ={ϕ,σ2w}g(t)Rt=Xt+ηt, (2)
σ 2 t X t R t X 1 ∼ N ( 0 , σ 2 w / [ 1 - ϕ 2 ] ) , R 1 ∼ N ( 0 , σ 2 w / [ 1 - ϕ 2 ] + σ 2 t ) . R t | R t -ηt∼N(0,σ2t)σ2tXtRtX1∼N(0,σ2w/[1−ϕ2]),
portanto,
O próximo desafio é obter para . Para derivar a distribuição dessa variável aleatória, observe que, usando a eq. Eu posso escrever
Usando a eq. e usando a definição da eq. , eu posso escrever,
Usando a eq. nessa última expressão, obtenho
portanto,
R1∼ N( 0 , σ2W/ [1- ϕ2] + σ2t) .
t≠1(2) X t - 1 = R t - 1 - η t - 1 . (3)(2)(1) R t = X t + η t =φ X t - 1 + ε t + η t . (3) R t =ϕ( RRt|Rt−1t≠1(2)Xt−1=Rt−1−ηt−1. (3)
(2)(1)Rt=Xt+ηt=ϕXt−1+εt+ηt.
(3)Rt=ϕ(Rt−1−ηt−1)+εt+ηt,
Rt|Rt−1=ϕ(rt−1−ηt−1)+εt+ηt,
e, portanto,
Finalmente, eu posso escrever a função de probabilidade como
onde são as distribuições das variáveis que acabei de definir, .ie, definindo
e definindo ,
Rt|Rt−1∼N(ϕrt−1,σ2w+σ2t−ϕ2σ2t−1).
L(θ)=fR1(R1=r1)∏t=2nfRt|Rt−1(Rt=rt|Rt−1=rt−1),
f(⋅)σ′2=σ2w/[1−ϕ2]+σ2t,
fR1( R1= r1) = 12 πσ′ 2-----√exp ( - r212 σ′ 2) ,
σ2( t ) = σ2W+ σ2t- ϕ2σ2t - 1fRt| Rt - 1( Rt= rt| Rt - 1= rt - 1) = 12 πσ2( T )------√exp ( - ( rt- ϕ rt - 1)22 σ2( T ))
3. Questões
- Minha derivação está correta? Não tenho outros recursos para comparar além de simulações (que parecem concordar) e não sou estatístico!
- Existe alguma derivação desse tipo de coisa na literatura para os processos ou ? MA ( 1 )A R MA ( 1 , 1 )Um estudo para os processos em geral que poderiam ser particularizados neste caso seria bom.A R MA ( p , q)
Respostas:
Você está no caminho certo, mas cometeu um erro ao derivar a distribuição de dado : a média condicional não é . É , onde é sua melhor estimativa de do período anterior. O valor de inclui informações de observações anteriores, bem como . (Para ver isso, considere uma situação em que e são desprezíveis, portanto você está efetivamente estimando uma média fixa. Depois de muitas observações, sua incerteza sobre será muito menor do queRt Rt - 1 ϕ rt - 1 ϕ xˆt - 1 xˆt - 1 X xˆt - 1 rt - 1 σW ϕ X ση .) Isto pode ser confuso no início, porque você observar e não . Isso significa apenas que você está lidando com um modelo de espaço de estado .R X
Sim, existe uma estrutura muito geral para o uso de modelos gaussianos lineares com observações ruidosas, chamada filtro de Kalman . Isso se aplica a qualquer coisa com uma estrutura ARIMA e muitos outros modelos também. Variação no tempo é válida para o filtro Kalman, desde que não seja estocástico. Modelos com, por exemplo, volatilidade estocástica precisam de métodos mais gerais. Para ver como o filtro Kalman é derivado, tente Durbin-Koopman ou o capítulo 3 de Harvey . Na notação de Harvey, seu modelo possui , , , , e .ση Z= 1 d= c = 0 Ht= σ2η, t T= ϕ R=1 Q=σ2w
fonte
Honestamente, você deve codificar isso em BUGs ou STAN e não se preocupar com isso a partir daí. A menos que seja uma questão teórica.
fonte