Quais são as alternativas de última geração aos Processos Gaussianos (GP) para regressão não-linear não paramétrica com incerteza de previsão, quando o tamanho do conjunto de treinamento começa a se tornar proibitivo para os GPs de baunilha, mas ainda não é muito grande?
Os detalhes do meu problema são:
- o espaço de entrada é de baixa dimensão ( , com )
- a saída é com valor real ( )
- os pontos de treinamento são , aproximadamente uma ordem de magnitude maior do que o que você poderia lidar com os GPs padrão (sem aproximações)
- a função a aproximar é uma caixa preta; podemos assumir continuidade e um grau relativo de suavidade (por exemplo, eu usaria uma matriz de covariância de Matérn com para um GP)
- para cada ponto consultado, a aproximação precisa retornar média e variância (ou medida análoga de incerteza) da previsão
- Preciso que o método seja reciclável relativamente rápido (da ordem de segundos) quando um ou alguns novos pontos de treinamento são adicionados ao conjunto de treinamento
Qualquer sugestão é bem-vinda (um ponteiro / menção a um método e por que você acha que isso funcionaria é suficiente). Obrigado!
Respostas:
Uma matriz de covariância de Matérn com 5/2 está quase convergindo para um núcleo exponencial ao quadrado.ν=5/2
Então eu acho que uma abordagem baseada na função de base radial (RBF) é perfeita nesse cenário. É rápido, funciona para o tipo de função de caixa preta que você possui e você pode obter medidas de incerteza.
Como alternativa, você pode usar aproximações de pontos de indução para GPs, dar uma olhada no FITC na literatura, mas você tem o mesmo problema de onde selecionar os pontos de indução.
fonte