O conjunto de dados em anexo mostra aproximadamente 6000 mudas em aproximadamente 50 aberturas florestais de tamanho variável. Estou interessado em aprender como essas mudas estão crescendo dentro de suas respectivas lacunas (ou seja, agrupadas, aleatórias, dispersas). Como você sabe, uma abordagem tradicional seria executar o I. global de Moran. No entanto, agregações de árvores dentro de agregados de lacunas parecem ser um uso inadequado do I. de Moran. Fiz algumas estatísticas de teste com o I de Moran, usando uma distância de 50 metros, que produziu resultados sem sentido (p-valor = 0,0000000 ...). A interação entre as agregações de gap provavelmente está produzindo esses resultados. Eu considerei criar um script para percorrer lacunas individuais do dossel e determinar o agrupamento dentro de cada lacuna, embora exibir esses resultados ao público seja problemático.
Qual é a melhor abordagem para quantificar o cluster dentro de clusters?
fonte
Respostas:
Você não possui um campo aleatório uniforme, portanto, a tentativa de analisar todos os seus dados ao mesmo tempo violará as suposições de qualquer estatística que você escolher lançar no problema. Não está claro em sua postagem se os dados são um processo pontual marcado (ou seja, diâmetro ou altura associado a cada local da árvore). Se esses dados não estão representando um processo pontual marcado, não faço ideia de como você aplicou um I de Moran. Se os dados representarem apenas locais espaciais, eu recomendaria o uso de um Ripley's-K com a transformação Besag-L para padronizar a expectativa nula em zero. Isso permite uma avaliação em várias escalas do cluster. Se seus dados tiverem um valor associado, sua melhor opção será um Moran's-I (LISA) local. Na verdade, eu olhava para isso com as duas estatísticas. Independentemente da sua escolha, você ainda precisará percorrer cada site individual para produzir resultados válidos. Aqui está um exemplo de código R para uma simulação de Monte Carlo do Ripley's-K / Besag's-L usando o conjunto de dados embutido de mudas de sequóias. Deve ser bastante simples modificá-lo para percorrer seus sites e produzir um gráfico para cada um.
fonte
O que você tem é um padrão de pontos com uma janela que é um número de pequenas regiões poligonais desconectadas.
Você deve poder usar qualquer um dos testes
package:spatstat
para o CSR desde que o alimente com uma janela correta. Pode ser um número de conjuntos de pares (x, y) que definem cada limpeza ou uma matriz binária de (0,1) valores no espaço.Primeiro vamos definir algo que se parece um pouco com seus dados:
e vamos fingir que nossas clareiras são células quadradas que são as seguintes:
Então, podemos traçar a função K desses pontos nessa janela. Esperamos que isso não seja CSR porque os pontos parecem agrupados dentro das células. Observe que eu tenho que alterar o intervalo de distâncias para ser pequeno - da ordem do tamanho da célula - caso contrário, a função K é avaliada por distâncias do tamanho de todo o padrão.
Se gerarmos alguns pontos de CSR nas mesmas células, poderemos comparar os gráficos da função K. Este deve ser mais parecido com CSR:
Você não pode realmente ver os pontos agrupados nas células no primeiro padrão, mas se você os desenhar por conta própria em uma janela gráfica, ficará claro. Os pontos no segundo padrão são uniformes dentro das células (e não existem na região preta) e a função K é claramente diferente da
Kpois(r)
função CSR K para os dados em cluster e semelhante para os dados uniformes.fonte
Além do post de Andy:
O que você deseja calcular é uma medida de homogeneidade espacial (logo, a hipótese: "Seus pontos estão agrupados?"), Como as funções L e K de Ripley .
Esta postagem no blog explica muito bem o como fazer em R. Com base no código descrito, eu primeiro rotularia cada cluster no seu conjunto de dados e, em seguida, calcularia em um loop para cada cluster o envelope crítico através do K da Ripley
fonte