Percebi em meu próprio trabalho esse padrão ao examinar um correlograma espacial em distâncias variadas, em que surge um padrão em forma de U nas correlações. Mais especificamente, fortes correlações positivas em pequenos compartimentos de distância diminuem com a distância, atingem um poço em um determinado ponto e depois subem de volta.
Aqui está um exemplo do blog Conservation Ecology, Macroecology playground (3) - Autocorrelação espacial .
Essas correlações automáticas positivas mais fortes a distâncias maiores violam teoricamente a primeira lei da geografia de Tobler, então eu esperaria que fosse causada por algum outro padrão nos dados. Eu esperaria que eles atingissem zero a uma certa distância e, em seguida, passassem o 0 em distâncias adicionais (o que normalmente acontece em gráficos de séries temporais com termos de AR ou MA de ordem baixa).
Se você fizer uma pesquisa de imagens no google, poderá encontrar alguns outros exemplos desse mesmo tipo de padrão (veja aqui outro exemplo). Um usuário no site GIS postou dois exemplos em que o padrão aparece no I de Moran, mas não no C de Geary ( 1 , 2 ). Em conjunto com meu próprio trabalho, esses padrões são observáveis para os dados originais, mas ao ajustar um modelo com termos espaciais e verificar os resíduos, eles parecem não persistir.
Não encontrei exemplos em análises de séries temporais que exibissem um gráfico de aparência semelhante ao ACF; portanto, não tenho certeza de qual padrão nos dados originais causaria isso. Scortchi neste comentário especula que um padrão sinusoidal pode ser causado por um padrão sazonal omitido nessa série temporal. O mesmo tipo de tendência espacial poderia causar esse padrão em um correlograma espacial? Ou é algum outro artefato da maneira como as correlações são calculadas?
Aqui está um exemplo do meu trabalho. A amostra é bastante grande e as linhas cinza-claras são um conjunto de 19 permutações dos dados originais para gerar uma distribuição de referência (para que se possa ver que a variação na linha vermelha deve ser bastante pequena). Portanto, embora o enredo não seja tão dramático quanto o primeiro mostrado, o poço e, em seguida, elevar-se a outras distâncias, aparecem bastante prontamente no enredo. (Observe também que o poço no meu não é negativo, como são os outros exemplos, se isso tornar os exemplos materialmente diferentes, não sei.)
Aqui está um mapa de densidade de kernel dos dados para ver a distribuição espacial que produziu o referido correlograma.
fonte
Respostas:
Explicação
Um correlograma em forma de u é uma ocorrência comum quando seu cálculo é realizado em toda a extensão da região em que um fenômeno ocorre. Ele aparece particularmente com fenômenos semelhantes a plumas na natureza, como contaminação localizada em solos ou águas subterrâneas ou, como neste caso, onde o fenômeno está associado a uma densidade populacional que geralmente diminui em direção aos limites da área de estudo (o Distrito de Columbia, que possui um núcleo urbano de alta densidade e é cercada por subúrbios de menor densidade).
Lembre-se de que o correlograma resume o grau de similaridade de todos os dados de acordo com a quantidade de separação espacial. Valores mais altos são mais semelhantes, valores mais baixos, menos semelhantes. Os únicos pares de pontos nos quais a maior separação espacial pode ser alcançada são aqueles situados em lados diametralmente opostos do mapa. O correlograma, portanto, está comparando valores ao longo do limite entre si. Quando os valores dos dados tendem a diminuir globalmente em direção ao limite, o correlograma pode comparar apenas valores pequenos a valores pequenos. Provavelmente os achará muito semelhantes.
Portanto, para qualquer fenômeno semelhante a uma pluma ou outro fenômeno espacialmente unimodal, podemos antecipar, antes de coletar os dados, que o correlograma provavelmente diminuirá até que cerca da metade do diâmetro da região seja atingido e começará a aumentar.
Um efeito secundário: variabilidade da estimativa
Um efeito secundário é que existem mais pares de pontos de dados disponíveis para estimar o correlograma em distâncias curtas do que em distâncias maiores. Em distâncias médias a longas, as "populações de defasagem" desses pares de pontos diminuem. Isso aumenta a variabilidade do correlograma empírico. Às vezes, essa variabilidade sozinha cria padrões incomuns no correlograma. Evidentemente, um grande conjunto de dados foi usado na figura superior ("Moran's I"), o que reduz esse efeito, mas, mesmo assim, o aumento na variabilidade é evidente nas amplitudes maiores das flutuações locais no gráfico a distâncias superiores a 3500: exatamente metade da distância máxima.
Uma regra prática de longa data nas estatísticas espaciais é, portanto, evitar o cálculo do correlograma a distâncias maiores que a metade do diâmetro da área de estudo e evitar o uso de grandes distâncias para previsão (como interpolação).
Por que a periodicidade espacial não é a resposta completa
A literatura sobre estatística espacial observa, de fato, que padrões periódicos espacialmente podem causar uma recuperação no correlograma a distâncias maiores. Os geólogos da mineração chamam isso de "efeito de buraco". Existe uma classe de variogramas que incorporam um termo senoidal para modelá-lo. No entanto, todos esses variogramas impõem também um forte decaimento com a distância e, portanto, não podem explicar o retorno extremo à correlação total mostrada na primeira figura. Além disso, em duas ou mais dimensões, é impossível que um fenômeno seja isotrópico (no qual os correlogramas direcionais sejam todos iguais) e periódico. Portanto, a periodicidade dos dados por si só não será responsável pelo que é mostrado.
O que pode ser feito
A maneira correta de proceder em tais circunstâncias é aceitar que o fenômeno não é estacionário e adotar um modelo que o descreva em termos de alguma forma determinística subjacente - uma "deriva" ou "tendência" - com flutuações adicionais em torno dessa deriva que pode ter autocorrelação espacial (e temporal). Outra abordagem para dados como o crime conta é estudar uma variável relacionada diferente, como crime por unidade de população.
fonte