Ajustamos uma função não linear aos dados observados. O próximo passo deve ser a avaliação da qualidade do ajuste dessa função (como para modelos lineares).
Quais são as formas usuais de medir isso?
Editar 1:
O encaixe foi realizado da seguinte maneira:
- Executar uma regressão linear com variáveis independentes A e B .
- Calcule os parâmetros da distribuição a partir dos parâmetros de regressão. (A distribuição é não linear e tem a variável C como entrada.)
- Avalie a qualidade do ajuste da distribuição não linear comparando os dados estimados com os observados.
Edição 2:
Exemplos para as etapas mencionadas acima:
- Modelo de regressão:
- e para a seguinte distribuição não linear:
- Avalie a qualidade do ajuste de com um determinado conjunto de observações .
goodness-of-fit
nonlinear
Marco
fonte
fonte
Respostas:
Talvez exista mais, mas para mim parece que você deseja apenas determinar a qualidade do ajuste (GoF) para uma função f (a), ajustada a um conjunto de dados específico (a, f (a)). Portanto, o seguinte responde apenas à sua terceira subquestão (não acho que a primeira e a segunda sejam diretamente relevantes para a terceira).
Normalmente, o GoF pode ser determinado parametricamente (se você conhece os parâmetros de função da distribuição) ou não parametricamente (se você não os conhece). Embora você possa descobrir parâmetros para a função, como ela parece exponencial ou gama / Weibull (assumindo que os dados sejam contínuos). No entanto, prosseguirei, como se você não conhecesse os parâmetros. Nesse caso, é um processo de duas etapas . Primeiro, você precisa determinar os parâmetros de distribuição para o seu conjunto de dados. Segundo, você executa um teste GoF para a distribuição definida. Para evitar me repetir, neste momento, encaminhá-lo-ei à minha resposta anteriora uma pergunta relacionada, que contém alguns detalhes úteis. Obviamente, essa resposta pode ser facilmente aplicada a distribuições, além da mencionada dentro.
Além dos testes GoF, mencionados aqui, você pode considerar outro teste - teste GoF qui-quadrado . Ao contrário de KS e AD testes, que são aplicáveis apenas ao distribuições contínuas, teste de qui-quadrado GoF é aplicável a ambos os discretas e contínuas queridos. O teste Qui-quadrado GoF pode ser executado no R usando um dos vários pacotes:
stats
pacote interno (funçãochisq.test()
) evcd
pacote (funçãogoodfit()
- somente para dados discretos). Mais detalhes estão disponíveis neste documento .fonte
Bem, no Machine Learning, a coisa chamada Validação Cruzada é realizada com bastante frequência para fins de teste de modelo (teste se esse tipo de modelo com esses hiperparâmetros - como número de graus de liberdade ou o que seja - se ajusta ao seu problema) - você divide seu dados várias vezes nos conjuntos de dados de treinamento e teste, execute a otimização sobre o conjunto de treinamento e calcule qualquer qualidade dos dados de teste. A maneira mais confidencial é executar a chamada "validação cruzada QxT-fold". O pseudocódigo pode ser como:
fonte