Cálculo manual do PACF

9

Estou tentando replicar o cálculo que o SAS e o SPSS fazem para a função de autocorrelação parcial (PACF). No SAS, é produzido através do Proc Arima. Os valores PACF são os coeficientes de uma auto-regressão da série de interesse em valores defasados ​​da série. Minha variável de interesse é vendas, portanto, calculo lag1, lag2 ... lag12 e execute a seguinte regressão OLS:

Yt=a0+a1Yt1+a2Yt2+a3Yt3++a12Yt12.

Infelizmente, os coeficientes que recebo nem chegam perto do PACF (defasagens de 1 a 12) que o SAS ou o SPSS fornecem. Alguma sugestão? Há algo de errado? O que me vem à mente é que a estimativa de mínimos quadrados desse modelo pode não ser apropriada e talvez outra técnica de estimativa deva ser usada.

Desde já, obrigado.

Andreas Zaras
fonte
É correta, por acaso? a12
whuber

Respostas:

13

Como você disse "Os valores PACF são os coeficientes de uma auto-regressão da série de interesse em valores defasados ​​da série" e acrescento onde o PACF (K) é o coeficiente do último (k-ésimo) atraso. Assim, para calcular o PACF do lag 3, por exemplo, calcule

Yt=a0+a1Yt1+a2Yt2+a3Yt3

e é o PACF (3).a3

Outro exemplo. Para calcular o PACF (5), estimar

Yt=a0+a1Yt1+a2Yt2+a3Yt3+a4Yt4+a5Yt5

e é o PACF (5).a5

Em geral, o PACF (K) é o coeficiente de ordem KTH de um modelo que termina com lag K. A propósito, o SAS e outros fornecedores de software usam a aproximação de Yule-Walker para calcular o PACF, que fornecerá estimativas ligeiramente diferentes do PACF. Eles fazem isso para eficiência computacional e, na minha opinião, duplicar os resultados em livros didáticos padrão.

IrishStat
fonte
11
+1. Se você não estiver familiarizado com o , uma boa maneira de usá-lo é clicar com o botão direito do mouse nas expressões relevantes da pergunta, escolha "Mostrar fonte" e copie e cole-as na sua resposta. Você pode fazer modificações, que geralmente são intuitivas e óbvias. Isso tornará suas respostas mais legíveis. TEX
whuber
Entendi! Excelente explicação mais uma vez. Muito obrigado!
Andreas Zaras
Sei que isso foi escrito há muito tempo, mas é uma das poucas referências ao cálculo do PACF como "coeficientes de uma auto-regressão da série de interesse em valores defasados ​​da série" que estou encontrando. Eu vejo isso na implementação de statsmodels.tsa.stattools.pacf - tedboy.github.io/statsmodels_doc/_modules/statsmodels/tsa/… . A Wikipedia lista três maneiras de calcular a correlação parcial : a) usando regressão linear e correlação de resíduos b) recursiva ec) inversão de matriz. Mas qual é a base teórica aqui?
ivaylo_iliev 26/03