Modelando uma tendência espacial por regressão com as coordenadas como preditores

9

Pretendo incluir coordenadas como covariáveis ​​na equação de regressão para ajustar a tendência espacial que existe nos dados. Depois disso, quero testar os resíduos na autocorrelação espacial em variação aleatória. Eu tenho várias perguntas:

  1. Devo realizar a regressão linear em que apenas variáveis independentes são e coordenadas e, em seguida, testa resíduos de autocorrelação espacial, ou devo sim incluir não só coordenadas como co-variáveis, mas também outras variáveis e, em seguida, resíduos de teste.xy

  2. Se eu espero ter uma tendência quadrática e incluir não apenas , mas também , e , mas alguns deles ( e ) têm o valor maior que o threshold - devo excluir as variáveis ​​com valor- mais alto por não serem significativas? Como devo interpretar a tendência, certamente não é mais quadrática?x,yxyx2y2xyy2pp

  3. Acho que eu deveria tratá- e coordenadas como quaisquer outras variáveis, e testá-los em ter relação linear com a variável dependente através da construção de gráficos de resíduos parciais ... mas, em seguida, uma vez que eu transformá-los (se eles mostram que eles precisam de transformação), que não vai seja esse tipo de tendência mais (especialmente se eu incluir , e para tendência quadrática). Pode mostrar que , por exemplo, precisa de transformação, enquanto não precisa ou não? Como devo reagir nessas situações?xyxyx2y2x2x

Obrigado.

Beka
fonte

Respostas:

3

Eu acho que é melhor você ajustar um modelo linear de efeitos mistos com efeitos aleatórios correlacionados espacialmente (às vezes chamado de modelo geoestatístico ). Supondo que seus dados sejam gaussianos, você especifica um modelo do formulário:

Yi=μi+Si+ϵi,

para observações , com representando erros iid e representando seus termos espaciais (onde ). A média pode ser uma função de outras covariáveis ​​(por exemplo, etc.) ou pode ser apenas uma constante (pode ser melhor começar com o último por simplicidade).n1inϵN(0,τ2)SMVN(0,σ2R)S={S1,...,Sn}μiμi=β0+β1xi1+β2xi2

A matriz de correlação para os termos espaciais (que determina como você acha que cada observação deve estar correlacionada) pode ser especificada observando o variograma empírico. Geralmente, a correlação entre as observações é escolhida para depender apenas da distância entre elas (é aqui que suas coordenadas entram no modelo).R

O capítulo 2 da geoestatística baseada em modelo de Diggle e Ribeiro (2000) deve fornecer uma introdução mais detalhada. O pacote geoR do R possui muitos procedimentos para ajustar modelos geoestatísticos, portanto você pode achar útil (consulte http://cran.r-project.org/web/packages/geoR/geoR.pdf ).

Sam Livingstone
fonte