Como interpretar esses gráficos acf e pacf

20

A seguir, são apresentados os gráficos acf e pacf de uma série de dados mensal. O segundo gráfico é acf com ci.type = 'ma':

insira a descrição da imagem aqui

A persistência de valores altos no gráfico ACF provavelmente representa uma tendência positiva a longo prazo. A questão é se isso representa variação sazonal?

Tentei ver sites diferentes sobre esse tópico, mas não tenho certeza se esses gráficos mostram sazonalidade.

Análise de plotagem ACF e PACF

Ajudar a interpretar gráficos de ACF e PACF

Ajude a entender a figura a seguir do ACF

Autocorrelação e interpretação parcial de autocorrelação

Edit: a seguir está o gráfico para lag até 60:

insira a descrição da imagem aqui

A seguir estão plotagens de diff (my_series):

insira a descrição da imagem aqui

E até o atraso 60:

insira a descrição da imagem aqui

Edit: Estes dados são de: Este é um método apropriado para testar efeitos sazonais nos dados da contagem de suicídios? Aqui, os colaboradores não consideraram o gráfico ACF e PACF de séries originais ou diferenciadas que vale a pena mencionar (portanto, não deve ser importante). Apenas parcelas de resíduos ACF / PACF foram mencionados em alguns locais.

rnso
fonte
1
Você pode adicionar algo sobre seus dados (por exemplo, um gráfico básico)? Você tentou algo assim stl()?
gung - Restabelece Monica
Eu estou tentando entender como determinar a sazonalidade a partir de gráficos ACF e pacf. A revisão da trama básica ou stl é necessária para isso? Não podemos determinar algo dessas parcelas?
rnso
1
Isso seria bom. Para maior clareza, sua pergunta não é realmente sobre o que está acontecendo com seus dados, mas sobre o que pode ser entendido a partir desses gráficos isoladamente, não é mesmo?
gung - Restabelece Monica
1
Sim. Muitas vezes, preciso determinar se a sazonalidade está presente nos meus dados, para que eu queira entender quais informações posso derivar dos gráficos ACF e PACF. Os gráficos da função stl são razoavelmente fáceis de entender, mas não esses gráficos.
rnso
Seus dados realmente têm alguma sazonalidade. Por favor, veja minha resposta a @javlacalle.
precisa saber é o seguinte

Respostas:

9

observar plotagens para tentar inserir os dados em um modelo de arima adivinhado funciona bem quando 1: não há valores extremos / pulsos / mudanças de nível, tendências de hora local e pulsos determinísticos sazonais nos dados E 2) quando o modelo de arima parâmetros constantes ao longo do tempo AND 3) quando a variação de erro do modelo arima apresenta variação constante ao longo do tempo. Quando essas três coisas acontecem .... na maioria dos conjuntos de dados de livros didáticos, apresentando a facilidade da modelagem de arima. Quando 1 ou mais dos 3 não se mantêm .... em todos os conjuntos de dados do mundo real que eu já vi. A resposta simples para sua pergunta requer acesso aos fatos originais (dados históricos) e não às informações descritivas secundárias em seus gráficos. Mas esta é apenas a minha opinião!

EDITADO APÓS O RECIBO DOS DADOS:

Eu estava de férias na Grécia (realmente fazendo outra coisa que não a análise de séries temporais) e não consegui analisar os DADOS DO SUICÍDIO, mas em conjunto com este post. Agora é adequado e correto que eu apresente uma análise para acompanhar / provar por exemplo meus comentários sobre estratégias de identificação de modelo em vários estágios e as falhas da análise visual simples de gráficos de correlação simples como "a prova está no pudim".

Aqui está o ACF dos dados originais insira a descrição da imagem aquiO PACF da série original insira a descrição da imagem aqui. AUTOBOX http://www.autobox.com/cms/ Um software que eu ajudei a desenvolver usa heurísticas para identificar um modelo inicial. Nesse caso, o modelo inicialmente identificado foi encontrado insira a descrição da imagem aqui. A verificação diagnóstica dos resíduos desse modelo sugeriu algum aumento do modelo usando uma mudança de nível, pulsos e um pulso sazonal. Todas as estradas não levam a Roma, mas algumas podem chegar perto!insira a descrição da imagem aqui. O teste de constância de parâmetros rejeitou alterações de parâmetros ao longo do tempo. A verificação de alterações determinísticas na variação de erro concluiu que nenhuma alteração determinística foi detectada na variação de erro. insira a descrição da imagem aqui. O teste de Box-Cox para a necessidade de uma transformação de potência foi positivo com a conclusão de que uma transformação logarítmica era necessária. insira a descrição da imagem aqui. O modelo final está aqui insira a descrição da imagem aqui. Os resíduos do modelo final parecem estar livres de qualquer autocorrelação insira a descrição da imagem aqui. O gráfico dos resíduos dos modelos finais parece estar livre de quaisquer violações gaussianas insira a descrição da imagem aqui. O gráfico de Real / Ajuste / Previsões está aqui insira a descrição da imagem aquicom previsões aquiinsira a descrição da imagem aqui

IrishStat
fonte
Obrigado pela sua resposta. Essas suposições são tão importantes e sempre tão desprezadas nos dados do mundo real que os gráficos de ACF e PACF quase nunca podem ser interpretados isoladamente?
rnso
Eu odeio dizer nunca, MAS as suposições que eu expus complicariam severamente o processo de identificação visual se violadas. Seu conjunto de dados claramente (aos meus velhos olhos) é um exemplo disso. Identificar um modelo inicial, estimar e re-identificar com base em diagnósticos residuais é um processo de vários estágios e não é EXCETO, em casos triviais.
precisa saber é o seguinte
Para reiterar a seguir meu amigo stats.stackexchange.com/users/48766/javlacalle : Também é necessário verificar a presença de pulsos e mudanças de nível E pulsos sazonais E tendências de hora local E constância de variação de erro.
precisa saber é o seguinte
(+1) Boa análise dos dados. No entanto, e a pergunta original? a sazonalidade pode ser identificada nos dados? Talvez isso possa ser inferido a partir da saída que você mostra, mas não consegui descobrir.
Javlacalle
sazonalidade está presente na AR (12) termo no modelo ARIMA e no pulso sazonal começando no período 98 (2003/2)
IrishStat
10

Interpretação do ACF e PACF

A lenta deterioração da função de autocorrelação sugere que os dados sigam um processo de memória longa. A duração dos choques é relativamente persistente e influencia os dados várias observações à frente. Isso provavelmente é refletido por um padrão de tendência suave nos dados.

O ACF e PACF da ordem 12 estão além das faixas de confiança de significância. No entanto, isso não significa necessariamente a presença de um padrão sazonal identificável. O ACF e o PACF de outros pedidos sazonais (24, 36, 48, 60) estão dentro das faixas de confiança. A partir do gráfico, não é possível concluir se o significado do ACF e PACF da ordem 12 é devido à sazonalidade ou flutuações transitórias.

A persistência da ACF mencionada anteriormente sugere que podem ser necessárias primeiras diferenças para tornar os dados estacionários. No entanto, o ACF / PACF da série diferenciada parece suspeito, a correlação negativa pode ter sido induzida pelo filtro diferencial e pode não ser realmente apropriado. Veja este post para mais detalhes.

Determinar se a sazonalidade está presente

A análise do ACF e PACF deve ser complementada com outras ferramentas, por exemplo:

  • O espectro (uma visão do ACF no domínio da frequência) pode revelar a periodicidade dos ciclos que explicam a maior parte da variabilidade nos dados.
  • Ajuste o modelo estrutural de série temporal básica e verifique se a variação do componente sazonal é próxima de zero em relação aos outros parâmetros (na função R stats::StructTSe no pacote stsm ).
  • Testes de sazonalidade, baseados em manequins sazonais, ciclos sazonais ou aqueles descritos e implementados no X-12 .
  • Também é necessário verificar a presença de pulsos e mudanças de nível, conforme mencionado pelo IrishStat, pois eles podem distorcer as conclusões dos métodos anteriores (em R os tsoutliers do pacote podem ser úteis para esse fim).
javlacalle
fonte
Eu adicionei plot até o atraso 60. Qual seria o comando R para obter "séries diferenciadas"? Vou adicionar plotagens para diff (my_series).
rnso
@mso Adicionei grandes alterações à minha resposta anterior. O comando para as séries diferenciadas é a função diffque você usou.
Javlacalle
javlacalle - havia dois parágrafos muito semelhantes e o @rnso tentou ajudar removendo um. Eu removi o que acho que é o que você deseja substituir. Você poderia verificar se o parágrafo correto foi removido?
Glen_b -Reinstala Monica
@Glen_b obrigado pela edição, fiz algumas alterações.
Javlacalle
@ javlacalle, @IrishStat: veja a edição na minha pergunta com os dados originais.
rnso