Na aplicação prática, tenho testemunhado frequentemente a prática a seguir. Observa-se um par longo do tempo. Pressupondo que eles estejam linearmente relacionados, regredimos um contra o outro usando pesos geométricos em vez de uniformes, ou seja, o OLS minimiza para alguns . Isso é muito intuitivo: pesamos menos observações no passado. Comparado a um esquema de ponderação de "vagão coberto", ele também tem a vantagem de produzir estimativas que mudam suavemente ao longo do tempo, porque as observações não caem abruptamente da janela de observação. No entanto, gostaria de saber se existe um modelo probabilístico subjacente à relação entre e
que justifica essa escolha.
regression
least-squares
gappy
fonte
fonte
Respostas:
"Relacionado linearmente" geralmente significa
para constante , e iid erros aleatórios , . Uma das razões seria fazer uma estimativa OLS exponencialmente ponderada é a suspeita de que e pode ser eles próprios (lentamente) variando com o tempo, também. Assim, realmente pensamos que o modelo correto éa b εt t=0,1,…,T a b
para desconhecidos funções e que variam lentamente (se em tudo) ao longo do tempo e nós estamos interessados em estimar seus valores atuais, e . Vamos supor que essas funções sejam suaves, para que possamos aplicar o Teorema de Taylor. Isto afirma queα(t) β(t) a=αT b=βT
para alguns e da mesma forma para . Pensamos em e como sendo os valores mais recentes, e , respectivamente. Use isto para reexprimir os resíduos:tα,t,0≤tα,t<T β(t) a b αT βT
Agora, muita coisa precisa acontecer. Consideraremos todo o lado direito como aleatório. Sua variação é a de mais vezes a variação de mais vezes a variação de . Essas duas variações são completamente desconhecidas, mas ( abracadabra ) vamos pensar nelas como resultado de algum tipo de processo (estocástico) no qual "erros" ou "variações" possivelmente sistemáticos (não aleatórios, mas ainda desconhecidos) são acumulados de uma só vez. o outro. Isso sugeriria uma exponencialεt x2t(t−T)2 α′(tα,t) (t−T)2 β′(tβ,t) mudança nessas variações ao longo do tempo. Agora, basta simplificar a expressão explícita (mas essencialmente inútil) do lado direito e absorver os termos quadráticos no exponencial (já que estamos agitando nossas mãos de maneira tão violenta), para obter(t−T)2
com a variação de igual a para alguma constante . Ignorar possíveis correlações temporais entre os e assumir que elas tenham distribuições normais fornece uma probabilidade de log para os dados proporcionais aδt exp(κ(t−T)) κ δt
(mais uma constante irrelevante dependendo apenas de ) com . O procedimento OLS ponderado exponencialmente, portanto, maximiza a probabilidade, assumindo que sabemos o valor de (como um procedimento de probabilidade de perfil).k k=expκ k
Embora toda essa derivação seja claramente fantasiosa, ela mostra como e aproximadamente em que grau a ponderação exponencial tenta lidar com possíveis alterações nos parâmetros lineares ao longo do tempo. Relaciona o parâmetro à taxa temporal de mudança desses parâmetros.k
fonte
Eu acho que você realmente quer dizer como seu peso, ou que . Se e tomamos como o peso, então . Portanto, isso realmente pesa menos a observação atual. Por exemplo, se considerarmos então e assim por diante.kt k>1 0<k<1 k−t k−∞=∞ k=0.5 k0=1,k−1=2,k−2=4,…,k−20≈106
Isso é apenas algo que você sabe sobre como a variação muda a cada observação (ela aumenta à medida que você se move para trás no tempo a partir do tempo ):T
Denotando e temos uma probabilidade conjunta de log de:Y≡{yT,yT−1,…,y1} X≡{xT,xT−1,…,x1}
Portanto, para obter as estimativas de probabilidade máxima de e você tem a seguinte função objetivo:a b
Qual é o que você procura
fonte