Estou trabalhando em um problema no qual preciso usar o Kriging para prever o valor de algumas variáveis com base em algumas variáveis circundantes. Eu quero implementar seu código sozinho. Então, eu examinei muitos documentos para entender como isso funciona, mas fiquei muito confuso. Geralmente, entendo que é uma média ponderada, mas não consegui entender completamente o processo de calcular o peso e prever o valor de uma variável.
Alguém por favor pode me explicar em termos simples os aspectos matemáticos desses métodos de interpolação e como funciona?
spatial
interpolation
kriging
Dania
fonte
fonte
Respostas:
Essa resposta consiste em uma seção introdutória que escrevi recentemente para um artigo que descreve uma extensão espaço-temporal (modesta) de "Universal Kriging" (Reino Unido), que por si só é uma modesta generalização de "Kriging comum". Possui três subseções: Teoria fornece um modelo estatístico e suposições; A estimativa revisa brevemente a estimativa do parâmetro dos mínimos quadrados; e Predição mostra como o kriging se encaixa na estrutura GLS (Generalized Least Squares). Fiz um esforço para adotar a notação familiar aos estatísticos, especialmente os visitantes deste site, e para usar conceitos bem explicados aqui.
Para resumir, kriging é a Melhor Previsão Linear Imparcial (BLUP) de um campo aleatório. O que isso significa é que o valor previsto em qualquer local não amostrado é obtido como uma combinação linear dos valores e covariáveis observados nos locais amostrados. O valor (desconhecido, aleatório) lá tem uma correlação assumida com os valores da amostra (e os valores da amostra são correlacionados entre si). Essas informações de correlação são prontamente traduzidas na variação da previsão. Escolhe-se coeficientes na combinação linear (os "pesos de krigagem") que tornam essa variação o menor possível, sujeita a uma condição de viés zero na previsão. Os detalhes a seguir.
Teoria
O Reino Unido compreende dois procedimentos - um de estimativa e outro de previsão - realizados no contexto de um modelo GLS para uma área de estudo. Os supõe modelo GLS que a amostra de dados são o resultado de desvios aleatórios em torno de uma tendência e que esses desvios estão correlacionados. Uma tendência é entendida no sentido geral de um valor que pode ser determinado por uma combinação linear de p coeficientes desconhecidos (parâmetros) β = ( β 1 , β 2 , … , βzEu, ( I = 1 , 2 , . . . , N ) p . (Ao longo deste post, o primo ′ denota a transposição da matriz e todos os vetores são considerados vetores de coluna.)β=(β1,β2,…,βp)′ ′
Em qualquer local dentro de uma área de estudo, está disponível uma tupla de atributos numéricos denominados "variáveis independentes" ou "covariáveis". (Normalmente y 1 = 1 é um “termo constante”, y 2 e y 3 podem ser coordenadas espaciais, e os y y i adicionaisy=(y1,y2,…,yp)′ y1=1 y2 y3 yi pode representar informações espaciais, bem como outras informações auxiliares disponíveis em todos os locais da área de estudo, como porosidade de um aqüífero ou distância de um poço de bombeamento.) Em cada local de dados , além de suas covariáveis y i = ( y i 1 , y i 2 , … , y i p ) ' , a observação associada z i é considerada uma realização de uma variável aleatória Z i . Por outro lado, o y ii yi=(yi1,yi2,…,yip)′ zi Zi yi são pensados como valores determinados ou caracterizando os pontos ou pequenas regiões representadas pelas observações (os dados “suportam”). O não são considerados como sendo as realizações de variáveis aleatórias e são obrigados a estar relacionado com as propriedades de qualquer um dos Z i .yi Zi
A combinação linear expressa o valor esperado de Z i em termos dos parâmetros de p , o qual é a valor da tendência no local i . O processo de estimativa utiliza os dados para encontrar valores p i que representam os parâmetros desconhecidos p i
Estimativa
Predição
(Os leitores familiarizados com a regressão múltipla podem achar instrutivo comparar essa solução com a solução baseada em covariância dos equações normais dos mínimos quadrados ordinários , que parece quase exatamente a mesma, mas sem termos multiplicadores de Lagrange.)
fonte