Análise de incerteza e sensibilidade

8

Eu tenho o seguinte problema:

Dadas as entradas ( vetor dimensional) de escalares, números inteiros ordenados e números não ordenados (ou seja, rótulos) e uma ou várias saídas , gostaria de estimar:xny

  1. Quais entradas explicam melhor as saídas.
  2. Até que ponto as variações de uma entrada implicam variações das saídas.

Supõe-se que isso esteja relacionado à análise de incerteza e sensibilidade, que são campos bastante amplos. Você conhece algum método / recurso com uma abordagem relacionada ao meu problema?

Flavian
fonte
Na pergunta, você quer dizer "sensibilidade" e não "sensibilidade".
22912 Michael Michael Chernick
2
Saltelli escreveu um texto útil e muitos trabalhos sobre análise de sensibilidade.
21812 David LeBauer

Respostas:

18

Você pode experimentar uma das ferramentas fornecidas aqui . São as soluções matlab, código muito bom e métodos modernos. Em primeiro lugar, sugiro que você tente ferramentas gráficas da biblioteca para fazer sentido sobre os dados.

Como você não forneceu os detalhes sobre o que precisa, aqui estão alguns comentários sobre os métodos implícitos:

Análise de sensibilidade global . A análise de sensibilidade global é o estudo de como a incerteza na saída de um modelo (numérica ou não) pode ser dividida em diferentes fontes de incerteza na entrada do modelo. Global poderia ser uma especificação desnecessária aqui, não fosse o fato de que a maioria das análises encontradas na literatura fosse local ou um fator por vez.

Análise de Monte-Carlo (ou baseada em amostra) . A análise de Monte Carlo (MC) baseia-se na realização de várias avaliações com entrada de modelo selecionada aleatoriamente e, em seguida, no uso dos resultados dessas avaliações para determinar tanto a incerteza nas previsões do modelo quanto na atribuição aos fatores de entrada de sua contribuição para essa incerteza. Uma análise de MC envolve a seleção de faixas e distribuições para cada fator de entrada; geração de uma amostra a partir das faixas e distribuições especificadas na primeira etapa; avaliação do modelo para cada elemento da amostra; análise de incerteza e análise de sensibilidade.

Metodologia de superfície de resposta . Este procedimento é baseado no desenvolvimento de uma aproximação da superfície de resposta ao modelo em consideração. Essa aproximação é então usada como substituta do modelo original na análise de incerteza e sensibilidade. A análise envolve a seleção de faixas e distribuições para cada fator de entrada, o desenvolvimento de um projeto experimental que define as combinações de valores de fatores nos quais avaliar o modelo, avaliações do modelo, construção de uma aproximação da superfície de resposta ao modelo original, análise de incerteza e análise de sensibilidade.

Projetos de triagem . A triagem de fatores pode ser útil como um primeiro passo ao lidar com um modelo que contém um grande número de fatores de entrada (centenas). Por fator de entrada, entendemos qualquer quantidade que possa ser alterada no modelo antes de sua execução. Pode ser um parâmetro de modelo ou uma variável de entrada ou um cenário de modelo. Freqüentemente, apenas alguns dos fatores de entrada e agrupamentos de fatores têm um efeito significativo na saída do modelo.

Local (Análise Diferencial) . A SA local investiga o impacto dos fatores de entrada no modelo localmente, ou seja, em algum ponto fixo no espaço dos fatores de entrada. A SA local é geralmente realizada calculando derivadas parciais das funções de saída em relação às variáveis ​​de entrada (análise diferencial). Para calcular a derivada numericamente, os parâmetros de entrada variam dentro de um pequeno intervalo em torno de um valor nominal. O intervalo não está relacionado ao nosso grau de conhecimento das variáveis ​​e geralmente é o mesmo para todas as variáveis.

FORMA-SORM . FORM e SORM são métodos úteis quando o analista não está interessado na magnitude de Y (e, portanto, em sua variação potencial), mas na probabilidade de Y exceder algum valor crítico. A restrição (Y-Ycrit <0) determina uma hiper-superfície no espaço dos fatores de entrada, X. A distância mínima entre algum ponto de design para X e a hiper-superfície é a quantidade de interesse.

Boa sorte!

Paulo
fonte
Infelizmente, o link fornecido nesta resposta "aqui" não está mais funcionando!
Nizar
2

Para abordar a primeira pergunta, sugiro que você dê uma olhada na análise de correlação canônica e em uma técnica de redução de dimensão mais recente chamada regressão inversa em fatias . Sobre este último, veja o artigo inicial de Ker Chau Li

Regressão inversa fatiada para redução de dimensão (com discussão). Jornal da Associação Estatística Americana, 86 (414): 316-327, 1991.

Está disponível gratuitamente na Internet. A versão com os comentários (interessantes) que você talvez precise comprar para pensar.

Alguns parâmetros importantes para a escolha de um método na sua situação são:

  • dimensionalidade da entrada (n = 3, n = 15 en = 50 são problemas muito diferentes);
  • tempo necessário para obter uma avaliação (0,1 s, 5 min e 5 horas também são problemas muito diferentes);
  • suposições que você pode fazer sobre o seu modelo: é linear? é monótono?

Você também menciona uma possível saída multivariada. Se você tem alguns deles que representam coisas completamente diferentes, faça várias análises de sensibilidade independentes.

Se eles são altamente correlacionados ou funcionais, isso também muda muito a problemática.

Você deve esclarecer todos esses pontos antes de seguir para uma determinada metodologia.

Alfred M.
fonte
2

Você pode usar uma abordagem de análise de sensibilidade global baseada em variação para responder à segunda pergunta. Segundo Saltelli (2008) , a análise de sensibilidade é

"... o estudo de como a incerteza na saída de um modelo pode ser dividida em diferentes fontes de incerteza na entrada do modelo ..."

StEuSEu

Para seus propósitos, uma vez que você tem um rancho de dados existente, é um método alternativo, como o sugerido pela Delta Moment-Independent Measure (Borgonovo 2007, Plischke et al. 2013) e implementado na biblioteca Python SALib .

O código a seguir, retirado do exemplo, permite gerar os índices de sensibilidade a partir dos dados existentes:

from SALib.analyze import dgsm
from SALib.util import read_param_file

# Read the parameter range file
problem = read_param_file('../../SALib/test_functions/params/Ishigami.txt')

# Perform the sensitivity analysis using the model output
# Specify which column of the output file to analyze (zero-indexed)
Si = dgsm.analyze(problem, param_values, Y, conf_level=0.95,     print_to_console=False)
# Returns a dictionary with keys 'vi', 'vi_std', 'dgsm', and 'dgsm_conf'
# e.g. Si['vi'] contains the sensitivity measure for each parameter, in
# the same order as the parameter file
willu47
fonte