Confusão em relação à krigagem

9

Eu estava lendo este artigo da Wikipedia relacionado ao kriging. Eu não entendi a parte quando diz que

Kriging calcula o melhor estimador imparcial linear, , de modo que a variação de krigagem seja minimizada com a condição de imparcialidade. Não obtive a derivação e também como a variação é minimizada. Alguma sugestão?Z^(x0)Z(x0)

Especialmente, não recebi a parte em que se aplica o assunto minimizado à condição de imparcialidade.

Eu acho que deveria ter sido

E [Z '(x0) -Z (x0)] em vez de E [Z' (x) -Z (x)] não é. 'é equivalente a hat no artigo da wiki. Também não entendi como o erro de kriging é derivado

user31820
fonte
Onde você fica preso na derivação?
whuber
A parte em que calcula o erro de krigagem e impõe a condição de imparcialidade. É bom dizer que condição imparcial significa que a expectativa do estimador e a verdadeira são iguais. Eu editei a postagem para incluir os detalhes.
user31820
Eu acho que você está correto que a expressão da Wikipedia deve ler . E[Z(x0)Z(x0)]
whuber

Respostas:

13

Suponha que é um vetor que se supõe ter uma distribuição multivariada de média desconhecida e matriz de variância-covariância conhecida . Observamos nesta distribuição e desejamos prever partir desta informação usando um preditor linear imparcial: (μ,μ,,μ)Σ ( z 1 , z 2 , , z n ) z 0(Z0 0,Z1 1,,Zn)(μ,μ,,μ)Σ(z1 1,z2,,zn) z0 0

  • Linear significa que a previsão deve assumir a forma para que os coeficientes sejam determinados. Esses coeficientes podem depender, no máximo, do que é conhecido antecipadamente: as entradas de .λiΣz0 0^=λ1 1z1 1+λ2z2++λnznλEuΣ

Esse preditor também pode ser considerado uma variável aleatória .Z0 0^=λ1 1Z1 1+λ2Z2++λnZn

  • Imparcial significa que a expectativa de é igual à sua (desconhecida) média . μZ0 0^μ

Escrever as coisas fornece algumas informações sobre os coeficientes:

μ=E[Z0^]=E[λ1Z1+λ2Z2++λnZn]=λ1E[Z1]+λ2E[Z2]++λnE[Zn]=λ1μ++λnμ=(λ1++λn)μ.

A segunda linha é devido à linearidade da expectativa e todo o resto é álgebra simples. Como esse procedimento deve funcionar independentemente do valor de , evidentemente os coeficientes precisam somar à unidade. Escrevendo os coeficientes na notação vetorial , isso pode ser escrito com .λ = ( λ i ) 1 λ = 1μλ=(λi)1λ=1

Entre o conjunto de todos esses preditores lineares imparciais, buscamos um que se desvie o mínimo possível do valor real , medido no quadrado médio da sala. Novamente, isso é uma computação. Baseia-se na bilinearidade e simetria da covariância, cuja aplicação é responsável pelos somatórios da segunda linha:

E[(Z0^Z0)2]=E[(λ1Z1+λ2Z2++λnZnZ0)2]=i=1nj=1nλiλjvar[Zi,Zj]2i=1nλivar[Zi,Z0]+var[Z0,Z0]=i=1nj=1nλiλjΣi,j2i=1nλiΣ0,i+Σ0,0.

De onde os coeficientes podem ser obtidos minimizando esta forma quadrática sujeita à restrição (linear) . Isso é facilmente resolvido usando o método dos multiplicadores de Lagrange, produzindo um sistema linear de equações, as "equações de Kriging".1λ=1

Na aplicação, é um processo estocástico espacial ("campo aleatório"). Isso significa que, para qualquer conjunto determinado de locais fixos (não aleatórios) , o vetor de valores de nesses locais é aleatório com algum tipo de distribuição multivariada. Escreva e aplique a análise anterior, assumindo que os meios do processo em todos os locais são os mesmos e assumindo a matriz de covariância dos valores do processo nesses locais é conhecido com certeza.Zx0,,xnZ(Z(x0 0),,Z(xn))ZEu=Z(xEu)n+1 1xEun+1 1

Vamos interpretar isso. Sob as premissas (incluindo média constante e covariância conhecida), os coeficientes determinam a variação mínima atingível por qualquer estimador linear. Vamos chamar essa variação de ("OK" é para "krigagem comum"). Depende apenas da matriz . Ele nos diz que, se formos amostrar repetidamente de e usar esses coeficientes para prever os valores valores restantes a cada vez,σOK2Σ(Z0 0,,Zn)z0 0

  1. Em média, nossas previsões seriam corretas.

  2. Normalmente, nossas previsões de se desviaram de dos valores reais de .z0 0σOKz0 0

Muito mais precisa ser dito antes que isso possa ser aplicado a situações práticas, como estimar uma superfície a partir de dados pontuais: precisamos de suposições adicionais sobre como as características estatísticas do processo espacial variam de um local para outro e de uma realização para outra (embora , na prática, geralmente apenas uma realização estará disponível). Mas essa exposição deve ser suficiente para acompanhar como a busca por um "melhor" preditor linear imparcial ("BLUP") leva diretamente a um sistema de equações lineares.


A propósito, krigar como normalmente praticado não é exatamente o mesmo que estimativa de mínimos quadrados, porque é estimado em um procedimento preliminar (conhecido como "variografia") usando os mesmos dados. Isso é contrário às premissas dessa derivação, que assumiram que era conhecido (e a fortiori independente dos dados). Assim, desde o início, o kriging possui algumas falhas conceituais e estatísticas incorporadas. Os praticantes atenciosos sempre estiveram cientes disso e encontraram várias maneiras criativas de (tentar) justificar as inconsistências. (Ter muitos dados pode realmente ajudar.) Agora existem procedimentos para estimar simultaneamenteΣΣΣe prever uma coleção de valores em locais desconhecidos. Eles exigem suposições um pouco mais fortes (normalidade multivariada) para realizar esse feito.

whuber
fonte
Existe um site lá fora, onde o cara reclama contra o kriging e parece que ele tem alguns pontos válidos. Eu acho que o seu parágrafo final aqui é muito esclarecedor.
21712 Wayne
@ Wayne Sim, você pode dizer o que estou reagindo. Porém, embora o kriging tenha sido usado como "óleo de cobra" por consultores, ele tem muito a oferecer, incluindo uma teoria de "mudança de suporte" para comparar dados obtidos de (digamos) pequenas amostras de um meio com dados obtidos de muito maiores porções desse meio. No fim das contas, Kriging está na base da modelagem espaço-temporal mais sofisticada da atualidade. Também é uma maneira útil de avaliar propostas alternativas: por exemplo, muitos interpoladores espaciais são lineares (ou podem ser linearizados); portanto, é justo comparar sua variação de estimativa com a de krigagem.
whuber
1

Kriging é simplesmente uma estimativa de mínimos quadrados para dados espaciais. Como tal, fornece um estimador imparcial linear que minimiza a soma dos erros ao quadrado. Como é imparcial, o MSE = variância do estimador e é mínimo.

Michael R. Chernick
fonte
Eu não obtive a parte que calculava o erro de krigagem. Qual é a diferença e qual é o seu significado
user31820
@whuber. Obrigado pela explicação, mas não obtive a derivação da equação quando você calculou o MSE do valor previsto pela estimativa imparcial e pelo verdadeiro estimador. A segunda linha a ser específica nessa equação
user31820
@whuber Também não recebi a parte do wiki quando calcula a variação de krigagem que é semelhante à da sua resposta. Eles têm os mesmos resultados, mas os termos iniciais são diferentes. Por quê?
user31820