Determinando as melhores séries temporais correlacionadas

8

Antes de perguntar, li perguntas semelhantes, mas nenhuma delas levou a respostas satisfatórias para meu interesse específico.

Quero homogeneizar uma série climática climática da República Dominicana ao longo de 64 anos (1940-2003). Para isso, é realmente importante selecionar uma série de referência entre um grupo de candidatos.

Digamos que sjoseja a série base, para a qual desejo encontrar uma boa série de referência; bani, plcE rasão candidatos de referência, porque eles estão perto sjo. No mapa a seguir, o ponto vermelho é a estação base e os verdes são os candidatos de referência:

Realizei três análises de correlação (realizadas em R, função cor()), considerando estas variáveis ​​mensais: valor bruto da precipitação, diferença normalizada e valores transformados com Box-Cox. Essas variáveis ​​correspondem, respectivamente, aos campos que começam com p, diane pnorm.

A diferença normalizada vem do método da primeira série de diferenças (FDM), proposto por Peterson, que consiste em: , onde é o valor da precipitação para o mês , e é a precipitação para o mesmo mês 1 ano antes. Segui a observação de Peterson e colegas (1998) , que afirma que o FDM aplicado à precipitação pode funcionar melhor usando diferença normalizada.P m t m P m t - 1[PmtPmt1]/[Pmt+Pmt1]PmtmPmt1

Como pode ser visto na página 1 deste arquivo PDF , a correlação foi calculada para toda a série temporal (1940-2003). Para precipitação bruta e valores transformados Box-Cox, banié o melhor correlacionado com sjo(as células amarelas de fundo mostram o índice máximo de correlação). Observe que, para precipitação bruta, banié significativamente mais correlacionada que outras. Para diferença normalizada, raé apenas um pouco mais correlacionada que o resto. No entanto, cada estação candidata possui um índice de correlação estatisticamente significante com sjoo nível de significância , sugerindo que QUALQUER uma delas possa ser usada como uma série de referência.α=.05

Isso é um pouco confuso, então fiquei insatisfeito e decidi fazer uma análise mais detalhada, dividindo as séries em intervalos de 5 anos e avaliando a correlação entre séries para as mesmas três variáveis: precipitação bruta, diferença normalizada e transformação Box-Cox .

As tabelas das páginas 2 a 8 no PDF mostram os resultados dessas correlações parciais; a última página resume os tempos em que cada estação teve o valor máximo de correlação para cada variável. Como pode ser visto, banié o valor correlacionado com mais frequência para as 3 variáveis ​​analisadas (em todos os casos, mais de 7 vezes dos doze períodos de 5 anos analisados).

Com esses resultados, acho que banié o melhor candidato como uma série de referência sjo, mas não tenho certeza. A análise do período de cinco anos está OK? Devo executar alguma outra análise?

JoseRamon
fonte
Obrigado @Nick pelas correções, eu aprendi muito com eles. Desculpe, o inglês não é minha língua materna.
precisa saber é o seguinte
Fico feliz em ajudar :) Seu trabalho já era mais claro do que o de muitos falantes nativos! Minhas mudanças foram apenas cosméticas e técnicas, não essenciais. Bem-vindo ao CV BTW!
Nick Stauner
as correlações são significativas, mas as diferenças entre essas correlações são diferentes? se não, então você não pode escolher uma estação de referência sobre outro baseado em correlações
Aksakal
Obrigado @Aksakal pelo seu comentário. Durante todo o período analisado, e exclusivamente para precipitação bruta, 'sjo' (série base) apresenta esses índices de correlação com candidatos de referência: 0,650 com 'bani', 0,536 com 'plc' e 0,557 com 'ra'. O maior índice é significativamente maior que o próximo mais correlacionado? Em relação às demais variáveis, diferença normalizada e Box-Cox transformada, a diferença não é grande. Devo aplicar outra análise? O que você me sugeriria?
precisa saber é o seguinte
@ JoseRamon, não posso responder a essas perguntas, você tem os dados. Você pode executar os testes estatísticos para ver se a diferença é significativa
Aksakal

Respostas:

1

Que tal experimentar um Anova de duas vias e um teste de pares, com os dados anuais e / ou os intervalos de 5 anos. Você também pode fazer isso com os dados brutos e normalizados ou com dados Box-Cox.

A idéia é que você possa procurar qualquer diferença não significativa (para a estação de referência) entre as distribuições de precipitação por estação.

Achei este link útil para iniciar seu próprio Two-Way-Anova via R r-tutorial-series-two-way-anova

Sebastian

tester1234
fonte
Obrigado Sebastian pela sua resposta. Vou tentar estas sugestões, o que parece muito útil. Eu usei em outra pesquisa e é muito poderoso.
precisa saber é o seguinte
Olá novamente @ tester1234. Estou tentando realizar o teste Two-Way Anova para meus dados. Com base no link que você me sugeriu: quais devem ser meus dois fatores? Posso dizer: quais variáveis ​​devo colocar dentro da função 'lm ()'? Eu tenho precipitação de 3 estações (pbani, pplc, pra) e quero saber qual delas está melhor correlacionada com a quarta (psjo). Tenho dados mensais agrupados em intervalos de 5 anos (os dados podem ser baixados deste link ). Agradecemos antecipadamente
JoseRamon /