Principais vantagens dos modelos de processos gaussianos

11

O processo gaussiano tem sido amplamente utilizado, especialmente em emulação. Sabe-se que a demanda computacional é alta ( ).0(n3)

  1. O que os torna populares?
  2. Quais são as suas principais e ocultas vantagens?
  3. Por que eles são usados ​​em vez de modelos paramétricos (por modelo paramétrico, quero dizer regressão linear típica na qual diferentes formas paramétricas podem ser usadas para descrever a tendência de entrada versus saída; por exemplo, qaudrático)?

Eu realmente aprecio uma resposta técnica que explique as propriedades inerentes que tornam o processo gaussiano único e vantajoso

Wis
fonte
Você pode esclarecer o que você quer dizer com modelos paramétricos?
Alexey Zaytsev
@ Alexey Esclarei o que quero dizer com modelo paramétrico acima. Obrigado
Wis
Pelo que presumo sobre modelos paramétricos, você precisa especificar o modelo manualmente para cada problema. Isso nem sempre é possível, pois a natureza verdadeira nem sempre é conhecida. Além disso, pode haver dificuldades com o ajuste desses modelos, enquanto, para os processos gaussianos, a estimativa de parâmetros funciona bem quase sempre.
Alexey Zaytsev
4
Splines e regressão linear são equivalentes à regressão de processos Gaussianos com a função de covariância adequada selecionada. Mas os processos gaussianos fornecem uma estrutura probabilística conveniente, adequada para muitas tarefas.
Alexey Zaytsev
1
Quando você não usaria o Processo Gaussiano?
Alby

Respostas:

6

As principais vantagens são do ponto de vista da engenharia (como o @Alexey mencionou). No procedimento de Kriging amplamente utilizado , você pode interpretar seu próprio "espaço", fornecendo um modelo de "correlação" (ou covariância) (normalmente chamado de elipse variograma de variograma ) para relações dependendo da distância e orientação.

Não há nada que impeça que outras metodologias tenham os mesmos recursos; aconteceu que o modo como o kriging foi conceitualizado pela primeira vez tinha uma abordagem amigável para pessoas que não eram estatísticas.

Atualmente, com o surgimento de metodologias estocásticas baseadas em geoestatística, como a simulação sequencial gaussiana, entre outras , esses procedimentos estão sendo utilizados em setores em que é importante definir o espaço de incerteza (que pode levar milhares a milhões de dimensões). Novamente, do ponto de vista da engenharia, algoritmos baseados em geoestatística são muito fáceis de incluir na programação genética . Assim, quando você tem problemas inversos, precisa testar vários cenários e a adaptabilidade deles à sua função de otimização.

Vamos deixar a argumentação pura por um momento e indicar os fatos para um exemplo real e moderno desse uso. Você pode amostrar amostras subterrâneas diretamente (dados concretos) ou fazer um mapa sísmico da subsuperfície (dados flexíveis).

Em dados concretos, você pode medir uma propriedade (digamos, impedância acústica) diretamente sem erro (ish). O problema é que isso é escasso (e caro). Por outro lado, você tem o mapeamento sísmico, que é literalmente um mapa de volume, em termos de pixel, da subsuperfície, mas não fornece impedância acústica. Por questões de simplicidade, digamos que ele fornece a relação entre dois valores de impedância acústica (superior e inferior). Portanto, uma proporção de 0,5 pode ser uma divisão de 1000/2000 ou 10.000 / 20.000. É um espaço de múltiplas soluções e várias combinações serão suficientes, mas apenas uma representa com precisão a realidade. Como voce resolve isso?

A maneira como a inversão sísmica funciona (os procedimentos estocásticos) é produzindo cenários plausíveis (e essa é outra história todos juntos) de impedância acústica (ou outras propriedades), transformando esses cenários em uma sísmica sintética (como a razão no exemplo anterior) e compare o sísmico sintético com o real (correlação). Os melhores cenários serão usados ​​para produzir ainda mais cenários, convergindo para uma solução (isso não é tão fácil quanto parece).

Levando isso em conta e falando do ponto de vista da usabilidade, eu responderia suas perguntas da seguinte maneira:

1) O que os torna populares é a usabilidade, a flexibilidade na implementação, um bom número de centros e instituições de pesquisa que continuam fazendo procedimentos gaussianos mais novos e mais adaptáveis ​​para vários campos diferentes (particularmente em geociências, GIS incluído).

2) As principais vantagens são , como mencionado anteriormente, usabilidade e flexibilidade do meu ponto de vista. Se é fácil de manipular e fácil de usar, basta fazê-lo. Não há características particulares nos processos gaussianos que não são reproduzíveis em outras metodologias (estatísticas ou outras).

3) Elas são usadas quando você precisa incluir mais informações em seu modelo do que apenas os dados (informações que possuem relações de espaço, distribuições estatísticas etc.). Posso garantir que, se você tem muitos dados com um comportamento isotrópico usando o kriging, é uma perda de tempo. Você pode obter os mesmos resultados usando qualquer outro método que, exigindo menos informações, seja mais rápido para executar.

armatita
fonte
E quando outro modelo é uma escolha melhor?
Ben
1
@ Ben Depende sempre do estudo de caso. Os métodos baseados em Kriging ou Kriging têm um alto custo de computação (portanto, não é rápido). Por exemplo, as TVs modernas de 4k (ou mais) usam métodos de interpolação para tentar melhorar o conteúdo criado para resoluções menores. Isso implica que ele precisa executar esta operação rapidamente e sem intervenção do usuário (o que um modelo de covariância exigiria). Se eu resolvesse esse problema em particular, evitaria Kriging por completo. Além disso, alguns fenómenos é padrão com base, ou tem uma variável discreta, ou pode ser reduzida a fórmula (MEF, por exemplo), etc ...
armatita
E quando a velocidade não é importante?
Ben Ben
@ Ben Speed ​​é menos importante se o seu resultado não precisar ser imediato. Modelagem de subsuperfície, previsão do tempo e várias operações nas ciências de GIS são apenas alguns exemplos. Outro é o apresentado na resposta (inversão sísmica).
Armatita 03/09/19
Desculpe, não entendi. Nem a velocidade computacional nem a velocidade do resultado são importantes, quais são as desvantagens de um GP? Ou em outras palavras: não deve ser usado com muito mais frequência?
Ben
7

Para os engenheiros, é importante:

  • ter intervalos de confiança para previsões
  • interpolar dados de treinamento
  • ter modelos suaves e não lineares
  • usar modelos de regressão obtidos para projeto adaptativo de experimentos e otimização

Os processos gaussianos atendem a todos esses requisitos.

Além disso, frequentemente os conjuntos de dados de engenharia e geoestatística não são tão grandes ou possuem estrutura de grade específica, permitindo inferência rápida.

Alexey Zaytsev
fonte
1
Obrigado pelo seu comentário. Parece que, devido à sua interpretação bayesiana, os modelos de processos gaussianos podem ter uma boa quantificação da incerteza, no entanto, isso também é possível na regressão paramétrica. Eu estou procurando uma abordagem técnica que pode explicar o conjunto de vantagens estatísticos
Wis
3

As vantagens do modelo gaussiano.

O PDF gaussiano depende apenas dos momentos de 1ª e 2ª ordem. Um processo gaussiano estacionário de sentido amplo também é um processo estacionário de sentido estrito e vice-versa.

Os PDFs gaussianos podem modelar a distribuição de muitos processos, incluindo algumas classes importantes de sinais e ruídos. A soma de muitos processos aleatórios independentes tem uma distribuição gaussiana (teorema do limite central).

Os processos não gaussianos podem ser aproximados por uma combinação ponderada (isto é, uma mistura) de vários pdfs gaussianos de meios e variações apropriados.

Métodos ótimos de estimativa baseados em modelos gaussianos geralmente resultam em soluções lineares e matematicamente tratáveis.

Wilson
fonte