Eu sou dado um grade de valores inteiros positivos. Esses números representam uma intensidade que deve corresponder à força de crença de uma pessoa que ocupa esse local na grade (um valor mais alto indicando uma crença mais alta). Uma pessoa em geral terá influência sobre várias células da grade.
Acredito que o padrão de intensidades deve "parecer gaussiano", pois haverá uma localização central de alta intensidade e, em seguida, as intensidades diminuem radialmente em todas as direções. Especificamente, eu gostaria de modelar os valores como provenientes de um "Gaussiano escalado" com um parâmetro para a variação e outro para o fator de escala.
Existem dois fatores complicadores:
- a ausência de uma pessoa não corresponderá a um valor zero, devido ao ruído de fundo e outros efeitos, mas os valores devem ser menores. Eles podem ser erráticos e, a princípio, pode ser difícil modelar como simples ruído gaussiano.
- A faixa de intensidade pode variar. Por um exemplo, os valores podem variar entre 1 e 10 e, em outro, entre 1 e 100.
Estou procurando uma estratégia de estimativa de parâmetros apropriada ou ponteiros para a literatura relevante. Ponteiros para por que estou abordando esse problema da maneira errada também serão bem-vindos :). Eu tenho lido sobre kriging e processos gaussianos, mas isso parece uma maquinaria muito pesada para o meu problema.
fonte
Respostas:
Você pode usar este módulo da biblioteca pysal python para os métodos de análise de dados espaciais discutidos abaixo.
Sua descrição de como a atitude de cada pessoa é influenciada pelas atitudes das pessoas ao seu redor pode ser representada por um modelo espacial auto-regressivo (SAR) (veja também minha explicação simples sobre SAR nesta resposta SE 2 ). A abordagem mais simples é ignorar outros fatores e estimar a força da influência de como as pessoas ao redor afetam as atitudes umas das outras usando a estatística I de Moran .
Se você deseja avaliar a importância de outros fatores enquanto estima a força da influência das pessoas ao redor, uma tarefa mais complexa, é possível estimar os parâmetros de uma regressão: . Veja os documentos aqui (os métodos para estimar esse tipo de regressão vêm do campo da econometria espacial e podem ficar muito mais sofisticados do que a referência que eu dei.)y= b x + r h o Wy+ e
Seu desafio será construir uma matriz de pesos espaciais ( ). Eu acho que cada elemento w i j da matriz deve ser 1 ou 0 com base em se a pessoa i está dentro de uma certa distância você sente que é necessário para influenciar a outra pessoa j .W Weu j Eu j
Para ter uma idéia intuitiva do problema, ilustro abaixo como um processo de geração de dados auto-regressivos (DGP) espacial criará um padrão de valores. Para as 2 treliças de valores simulados, os blocos brancos representam valores altos e os blocos escuros representam valores baixos.
Na primeira rede abaixo, os valores da grade foram gerados por um processo aleatório normalmente distribuído (ou Gaussiano), em que é zero.rho
fonte
Aqui está uma idéia simples que pode funcionar. Como eu disse nos comentários, se você tem uma grade com intensidades, por que não se encaixa na densidade da distribuição bivariada?
Aqui está o gráfico de exemplo para ilustrar meu ponto:
Cada ponto de grade com é exibido como um quadrado, colorido de acordo com a intensidade. Sobreposto ao gráfico está o gráfico de contorno do gráfico de densidade normal bivariada. Como você pode ver, as linhas de contorno se expandem na direção da intensidade decrescente. O centro será controlado pela média do normal bivariado e a difusão da intensidade de acordo com a matriz de covariância.
Para obter as estimativas da matriz de média e covariância, pode-se usar uma otimização numérica simples, compare as intensidades com os valores da função densidade usando a matriz de média e covariância como parâmetros. Minimize para obter as estimativas.
Obviamente, isso não é uma estimativa estatística, mas pelo menos lhe dará uma idéia de como prosseguir.
Aqui está o código para reproduzir o gráfico:
fonte
Um efeito 'gaussiano' corresponde a uma função de distância quadrática, mas há muitas outras funções de distância que você deve considerar, como a norma do táxid([i1,j1],[i2,j2])=|i1−i2|+|j1−j2| ρ(d) por exemplo, via probabilidade máxima. Para mais idéias, procure por "campo aleatório".
fonte