Processo de ponto espacial: uma função de intensidade de primeira ordem não homogênea afeta a dependência de segunda ordem?

Como o título sugere, estou tendo um pouco de confusão sobre o efeito da função de intensidade de primeira ordem. Se eu tenho uma função de intensidade de primeira ordem que diz que em uma determinada região os pontos são muito mais prováveis de ocorrer, isso significa que haveria muito mais pontos nessa região e parece que os pontos estão agrupados nessa região e subsequentemente sugere que nessa região os padrões de pontos estão agrupados. Portanto, parece que a falta de homogeneidade da intensidade de primeira ordem afeta a intensidade de segunda ordem.

Meu entendimento é que a função de intensidade de primeira ordem especifica o nível geral de intensidade em que os pontos ocorrem. Então, com base nessa intensidade, se os pontos em uma determinada região são agrupados ou repulsivos em comparação com a mesma intensidade, o processo de Poisson é determinado pela função de intensidade de segunda ordem.

Se meu entendimento estiver correto, qualquer padrão de pontos poderá ser considerado um processo de Poisson não homogêneo se descrevermos a intensidade de primeira ordem o mais detalhada possível. Mas é claro que esse será um caso de sobreajuste.

Esse entendimento está correto?

spatial point-process davidolohowski
fonte

A intensidade de primeira ordem e a intensidade de segunda ordem medem aspectos diferentes de um processo que pode variar quase independentemente. Em particular, nem todo processo pontual pode ser considerado um processo Poisson não homogêneo.

Vamos lidar com essa última edição primeiro. Considere um processo Poisson homogêneo no intervalo $[0,1].$ As lacunas tenderão a seguir uma distribuição exponencial. Vamos comparar com um processo que tende a manter um espaçamento mais uniforme, um processo "aleatório estratificado". É criado dividindo o intervalo em mil posições não sobrepostas e selecionando um ponto aleatoriamente uniforme dentro de cada posição. Eles têm as mesmas intensidades de primeira ordem, conforme sugerido por essas estimativas a partir de uma única realização de cada processo:

Esses processos são facilmente distinguidos examinando os intervalos entre valores sucessivos:

É verdade que certas formas de "agrupamento" podem ser caracterizadas pela intensidade de segunda ordem - mas não todas. Clustering pode significar qualquer combinação de duas coisas:

Agrupamento de "primeira ordem" perto de um local $s$ apenas significa que costuma haver mais pontos em um bairro de $s$ em todas as realizações.
Agrupamento de "segunda ordem" perto de um local $s$ significa a aparência de um ponto próximo a $s$ está associado à aparência de pontos em outros locais próximos $s.$

Isso parece sutil, então vamos contrastar alguns exemplos. Eu criei realizações de dois processos: um que é simplesmente não homogêneo, com uma intensidade cinco vezes maior no intervalo $(0,1/2]$ do que no intervalo $(1/2,1]$ ; e outro que é igualmente homogêneo, mas agrupado no intervalo $(0,1/2]$ . Para gerar o último, criei uma sequência de variáveis exponenciais iid $dX_i$ , multiplicado cada quinto deles por $100,$ e calculou sua soma acumulada $X_i,$ finalmente dividindo por duas vezes sua soma para colocá-los dentro do intervalo $(0,1/2].$ O processo no intervalo $(1/2,1]$ é um processo de Poisson homogêneo, como antes. Isso criou um processo no qual tendem a haver grupos restritos de quatro pontos, todos amplamente separados um do outro. Porém, como as diferenças entre esses pontos são aleatórias, os locais onde esses agrupamentos ocorrem tendem a não ser os mesmos de uma realização para outra. Quando você tem a oportunidade de visualizar várias realizações de um processo, essa é uma maneira de distinguir a não homogeneidade (que persistirá de uma realização para a próxima) do cluster (que pode ocorrer em qualquer lugar, não necessariamente em locais fixos).

A realização de cada processo aparece como uma plotagem de tapete na parte inferior. Os pontos são um gráfico de dispersão do $(X_i, dX_i)$ pares: ou seja, as alturas representam graficamente as lacunas para o próximo ponto à direita. Os gráficos de dispersão distinguem claramente os dois processos.

whuber
fonte

Obrigado pela resposta. Isso certamente esclareceu a maioria das minhas confusões. No entanto, isso também cria outra pergunta para mim e eu quero fazer isso direito. Pelo que você disse, é verdade que, se eu não conheço o processo de geração de dados e tenho apenas uma realização do processo pontual, a inomogeneidade de primeira ordem e a estrutura de dependência de segunda ordem são sempre indistinguíveis conforme mencionado por Ege?

Davidolohowski

Não concordo com essa conclusão, porque uma análise das lacunas do vizinho mais próximo pode ajudar a distingui-las. Concordo que, em muitos casos, pode ser difícil distinguir esses fenômenos, mas é definitivamente possível fazê-lo em alguns casos.

whuber

Acho que não fui suficientemente claro sobre o que eu quis dizer. Eu quis dizer se eu tenho apenas um conjunto de dados de um processo de ponto que eu não conheço, por exemplo, o processo de ponto em cluster no seu segundo exemplo. Parece-me que, neste caso, não há como distinguir inomogeneidade de primeira ordem e estrutura de dependência de segunda ordem. Como me parece possível ajustar uma função de intensidade de primeira ordem muito detalhada para descrever o processo, bem como as lacunas vizinhas mais próximas. É claro que isso é super adequado. No entanto, parece provar meu argumento.

Davidolohowski

Concordo que, com suposições razoáveis, você pode ter alguma sorte em usar um único padrão de pontos para separar a falta de homogeneidade e o agrupamento "real" (e mais facilmente inibição) devido às interações entre os pontos. No entanto, você sempre pode se referir ao caso degenerado e dizer que o processo subjacente é Poisson não homogêneo, com massas praticamente pontuais nos pontos observados, portanto, no sentido matemático, sem outras suposições, acho que você não pode realmente progredir. É claro que isso é desinteressante do ponto de vista prático e não do ponto de vista que estou defendendo de alguma maneira.

Ege Rubak

@ Age Obrigado por essa análise. Parece-me que o modelo extremo que você descreve é um tipo de modelo "saturado" com alto número de parâmetros que pode ser comparado a outros modelos parcimoniosos de maneiras padrão (por meio da AIC, validação cruzada etc.), possibilitando assim desenvolver opiniões objetivas e informadas sobre a natureza do processo subjacente.

whuber

Processo de ponto espacial: uma função de intensidade de primeira ordem não homogênea afeta a dependência de segunda ordem?

Respostas: