Como funciona a interpolação de Kriging?

10

Estou trabalhando em um problema no qual preciso usar o Kriging para prever o valor de algumas variáveis ​​com base em algumas variáveis ​​circundantes. Eu quero implementar seu código sozinho. Então, eu examinei muitos documentos para entender como isso funciona, mas fiquei muito confuso. Geralmente, entendo que é uma média ponderada, mas não consegui entender completamente o processo de calcular o peso e prever o valor de uma variável.

Alguém por favor pode me explicar em termos simples os aspectos matemáticos desses métodos de interpolação e como funciona?

Dania
fonte
3
A implementação de código é uma ótima ferramenta de aprendizado, mas não pode ser recomendada para trabalhar com problemas reais. No momento em que o código for escrito, depurado e testado, você descobrirá que é necessário uma ordem de magnitude maior para fornecer ferramentas suplementares para análise de dados exploratórios espaciais, variografia, validação cruzada do variograma, pesquisa de vizinhança e pós- processamento dos resultados krigados. Um compromisso razoável e eficaz seria começar com o código ativo , como GSLib ou GeoRGLM , e modificá-lo.
whuber
Muito obrigado, é uma ótima idéia, mas também quero entender o aspecto matemático do Kriging. Você tem um recurso que o explique claramente em termos simples? Obrigado.
Dania

Respostas:

15

Essa resposta consiste em uma seção introdutória que escrevi recentemente para um artigo que descreve uma extensão espaço-temporal (modesta) de "Universal Kriging" (Reino Unido), que por si só é uma modesta generalização de "Kriging comum". Possui três subseções: Teoria fornece um modelo estatístico e suposições; A estimativa revisa brevemente a estimativa do parâmetro dos mínimos quadrados; e Predição mostra como o kriging se encaixa na estrutura GLS (Generalized Least Squares). Fiz um esforço para adotar a notação familiar aos estatísticos, especialmente os visitantes deste site, e para usar conceitos bem explicados aqui.

Para resumir, kriging é a Melhor Previsão Linear Imparcial (BLUP) de um campo aleatório. O que isso significa é que o valor previsto em qualquer local não amostrado é obtido como uma combinação linear dos valores e covariáveis ​​observados nos locais amostrados. O valor (desconhecido, aleatório) lá tem uma correlação assumida com os valores da amostra (e os valores da amostra são correlacionados entre si). Essas informações de correlação são prontamente traduzidas na variação da previsão. Escolhe-se coeficientes na combinação linear (os "pesos de krigagem") que tornam essa variação o menor possível, sujeita a uma condição de viés zero na previsão. Os detalhes a seguir.


Teoria

O Reino Unido compreende dois procedimentos - um de estimativa e outro de previsão - realizados no contexto de um modelo GLS para uma área de estudo. Os supõe modelo GLS que a amostra de dados são o resultado de desvios aleatórios em torno de uma tendência e que esses desvios estão correlacionados. Uma tendência é entendida no sentido geral de um valor que pode ser determinado por uma combinação linear de p coeficientes desconhecidos (parâmetros) β = ( β 1 , β 2 , , βzi, (i=1,2,...,n)p . (Ao longo deste post, o primo denota a transposição da matriz e todos os vetores são considerados vetores de coluna.)β=(β1,β2,,βp)

Em qualquer local dentro de uma área de estudo, está disponível uma tupla de atributos numéricos denominados "variáveis ​​independentes" ou "covariáveis". (Normalmente y 1 = 1 é um “termo constante”, y 2 e y 3 podem ser coordenadas espaciais, e os y y i adicionaisy=(y1,y2,,yp)y1=1y2y3yipode representar informações espaciais, bem como outras informações auxiliares disponíveis em todos os locais da área de estudo, como porosidade de um aqüífero ou distância de um poço de bombeamento.) Em cada local de dados , além de suas covariáveis y i = ( y i 1 , y i 2 , , y i p ) ' , a observação associada z i é considerada uma realização de uma variável aleatória Z i . Por outro lado, o y iiyi=(yi1,yi2,,yip)ziZiyisão pensados ​​como valores determinados ou caracterizando os pontos ou pequenas regiões representadas pelas observações (os dados “suportam”). O não são considerados como sendo as realizações de variáveis aleatórias e são obrigados a estar relacionado com as propriedades de qualquer um dos Z i .yiZi

A combinação linear expressa o valor esperado de Z i em termos dos parâmetros de p , o qual é a valor da tendência no local i . O processo de estimativa utiliza os dados para encontrar valores p i que representam os parâmetros desconhecidos p i

E[Zi]=yiβ=yi1β1+yi2β2++yipβp
Ziβiβ^iβi, enquanto o processo de previsão usa os dados nos locais para calcular um valor em um local não amostrado, que é aqui indexado como i = 0 . Os alvos de estimação são fixas ( ou seja, os parâmetros, não aleatórios), enquanto que o alvo de predição é aleatória, porque o valor de z 0 inclui uma flutuação aleatória em torno da sua tendência y ' 0 β . Normalmente, são feitas previsões para vários locais usando os mesmos dados, variando o local 0i=1,2,,ni=0z0y0β0. Por exemplo, geralmente são feitas previsões para mapear uma superfície ao longo de uma grade regular de pontos adequados para o contorno.

Estimativa

ZiZiZjcij

β^=Hz, H=(YC1Y)1YC1
z=(z1,z2,,zn)nY=(yij)npyi,1inC=(cij)nnpnHzβ^β^C=(cij)

Predição

z0

z^0=λ1z1+λ2z2++λnzn=λz.
λiz0z0ZiZ0
0=E[Z^0Z0]=E[λZZ0].
n+1Z0Z=(Z1,Z2,,Zn)
0=E[λZZ0]=λE[Z]E[Z0]=λ(Yβ)y0β=(λYy0)β=β(Yλy0)

β

Y^λ=y0.

λZ^0Z0

Var(Z^0Z0)=E[(Z^0Z0)2]=E[(λZZ0)2]=c002λc0+λCλ
c0=(c01,c02,,c0n)Z0Zi, i1c00Z0

λpμY^λ=y0n+p

(CYY0)(λμ)=(c0y0)
0pp1nnλ
λ=Hy0+C1(1YH)c0.

(Os leitores familiarizados com a regressão múltipla podem achar instrutivo comparar essa solução com a solução baseada em covariância dos equações normais dos mínimos quadrados ordinários , que parece quase exatamente a mesma, mas sem termos multiplicadores de Lagrange.)

λ[Hy0]Z0z^0

whuber
fonte
11
Muito obrigado whuber, é exatamente isso que estou procurando. Você resolveu esse problema para mim, agora eu entendo Kriging. Eu realmente aprecio sua ajuda, muito obrigado.
Dania
Y^
Y=(yji)pnyi,1in