Regressão e aprendizado de máquina são usados nas ciências naturais para testar hipóteses, estimar parâmetros e fazer previsões ajustando modelos aos dados. No entanto, quando tenho um modelo a priori , não quero fazer nenhum ajuste - por exemplo, um modelo de um sistema físico determinístico calculado a partir dos primeiros princípios. Eu simplesmente quero saber o quão bem meu modelo corresponde aos dados e depois entender quais partes do modelo contribuem significativamente para a correspondência. Alguém poderia me indicar uma maneira estatisticamente rigorosa de fazer isso?
Em termos mais específicos, suponha que eu tenha um sistema físico para o qual medi uma variável dependente ( varia de 1 a , o tamanho da amostra) sob condições variáveis descritas por três variáveis independentes , e . Embora o sistema real que gerou os dados seja complicado, fiz algumas suposições simplificadoras para derivar um modelo teórico para o sistema, de modo que
,
onde é uma função não linear (e não linearizável) das variáveis independentes e é a diferença entre os valores previstos e medidos pelo modelo. é completamente pré-especificado; nenhum ajuste é feito e nenhum parâmetro é estimado. Meu primeiro objetivo é determinar se é um modelo razoável para o processo que produziu os valores medidos .
I também desenvolveu modelos simplificado e , os quais são encaixados em (se o que importa, neste caso). Meu segundo objetivo é determinar se coincide com os dados significativamente melhor do que ou , sugerindo que as características que diferenciam modelo a partir de modelos e desempenham um papel importante no processo que gera .
Idéias até agora
Talvez se houvesse alguma maneira de determinar o número de parâmetros ou o número de graus de liberdade para o meu modelo matemático, seria possível usar procedimentos existentes como um teste de razão de verossimilhança ou comparação da AIC. No entanto, dada a forma não linear de e a ausência de parâmetros óbvios, não tenho certeza se é razoável atribuir parâmetros ou assumir o que constitui um grau de liberdade.
Li que medidas de qualidade de ajuste, como o coeficiente de determinação ( ), podem ser usadas para comparar o desempenho do modelo. No entanto, não está claro para mim qual pode ser o limite para uma diferença significativa entre os valores de . Além disso, como eu não encaixo o modelo nos dados, a média dos resíduos não é zero e pode ser diferente para cada modelo. Assim, um modelo de boa correspondência que tende a subestimar os dados pode render um valor tão baixo de quanto um modelo que não foi imparcial, mas com baixa correspondência com os dados.
Também li um pouco sobre testes de adequação (por exemplo, Anderson-Darling), mas como a estatística não é o meu campo, não tenho certeza de quão bem esse tipo de teste se ajusta ao meu objetivo. Qualquer orientação seria apreciada.
f()
que precisam ser determinados a partir de um ajuste nos dados ou a função éf()
completamente pré-especificada?f
é completamente pré-especificado. É como uma caixa preta que produz a resposta ay
partir das variáveis de entrada, e quero saber como está indo em comparação com as caixas pretas concorrentes. Uma situação análoga pode estar tentando avaliar a correspondência entre a saída de uma simulação numérica e as medições feitas no sistema físico real.Respostas:
Nesta situação, você está comparando essencialmente as distribuições de entre os três modelos. Então, você precisa examinar questões como:ϵi
Os detalhes da melhor forma de abordar essas questões dependerão da natureza dos seus dados. Por exemplo, se os valores de forem necessariamente positivos e apresentarem erros de medição típicos proporcionais a seus valores (como costuma ser o caso na prática), pode fazer sentido fazer essa análise sobre as diferenças entre previsões transformadas em log e transformadas em log de cada um dos seus modelos.yi yi
A análise visual das distribuições do entre os três modelos, por exemplo, com gráficos de densidade, seria um primeiro passo importante.ϵi
Dependendo da natureza dos dados, os testes estatísticos paramétricos ou não paramétricos padrão para diferenças nos valores médios, aplicados ao para os três modelos, abordariam a questão 1.ϵi
A edição 2 é essencialmente o que é feito para examinar a qualidade de qualquer modelo ajustado; no seu caso, essa análise pode mostrar domínios das variáveis independentes sobre as quais um ou mais de seus modelos pré-especificados não funcionam bem. Gráficos de versus valores previstos e valores de variáveis independentes, com curvas de loess para destacar tendências, para cada um dos seus modelos seriam úteis.ϵi
Se não houver viés em nenhum modelo e a análise do problema 2 não apresentar problemas, o problema 3 restante é se algum dos modelos é superior em termos de precisão / variação. No caso ideal com normalmente distribuído em cada modelo, os testes F podem testar a igualdade de variações.ϵi
fonte
Uma comparação probabilística dos modelos, por exemplo, envolvendo alguma probabilidade calculada a partir do com alguns dados (e derivada desse teste de AIC ou razão), faz pouco sentido.ϵ
Isto é porque
Na maioria das vezes, as pessoas descrevem modelos em termos da porcentagem de erro nas previsões.
Exemplos:
Previsão de queda de pressão de fluxo de tubo de lodo usando correlações do fator de atrito da lei de potência composta - correlações do número de Reynolds com base em diferentes números não-newtonianos de Reynolds
Previsão da viscosidade efetiva de nanofluidos com base na reologia de suspensões de partículas sólidas
Aplicação de inteligência artificial na modelagem de viscosidade de asfalto - borracha
Método de contribuição de títulos para estimar as constantes da lei de henry
Basicamente, você pode pesquisar no Google qualquer modelo que seja uma simplificação da realidade e encontrará pessoas descrevendo sua discrepância com a realidade em termos de coeficientes de correlação ou porcentagem de variação.
Para essa comparação, você pode considerar o desempenho medido como uma amostra, uma amostra retirada de uma população maior (hipotética) de desempenho.
Então você deseja descrever os parâmetros da distribuição populacional dos erros e compará-los. Isso você pode considerar probabilístico. Por exemplo, você pode defini-lo como 'o erro médio do modelo é ' . Sua hipótese é sobre os parâmetros que descrevem a distribuição dos erros.ϵ y ± xy±x
No entanto, essa visão é um pouco problemática, pois muitas vezes a "amostra" usada para medir o desempenho não é realmente uma seleção aleatória (por exemplo, são medições em um intervalo predefinido ou entre um conjunto prático selecionado de itens). Portanto, qualquer quantificação do erro na estimativa de desempenho geral não deve ser baseada em um modelo para seleção aleatória (por exemplo, usando variação na amostra para descrever o erro da estimativa). Portanto, ainda faz pouco sentido usar um modelo probabilístico para descrever as comparações. Pode ser suficiente apenas declarar dados descritivos e fazer sua "estimativa" sobre a generalização com base em argumentos lógicos.
fonte
x_3,i
contribui contribui de forma mensurável para a produção dey
. O modelof
incorpora o fenômeno Um tempog
eh
não, portanto, se minha hipótese fosse verdadeira, eu previria que o modelo tivesse umf
desempenho significativamente melhor que umg
ou outroh
.