Como ler a qualidade do ajuste nos nls de R?

12

Eu estou tentando interpretar a saída de nls (). Eu li este post, mas ainda não entendo como escolher o melhor ajuste. Dos meus ajustes, tenho duas saídas:

> summary(m)

  Formula: y ~ I(a * x^b)

  Parameters:
  Estimate Std. Error t value Pr(>|t|)    
  a 479.92903   62.96371   7.622 0.000618 ***
  b   0.27553    0.04534   6.077 0.001744 ** 
  ---
  Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 

  Residual standard error: 120.1 on 5 degrees of freedom

  Number of iterations to convergence: 10 
  Achieved convergence tolerance: 6.315e-06 

e

> summary(m1)

  Formula: y ~ I(a * log(x))

  Parameters:
  Estimate Std. Error t value Pr(>|t|)    
  a   384.49      50.29   7.645 0.000261 ***
  ---
  Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 

  Residual standard error: 297.4 on 6 degrees of freedom

  Number of iterations to convergence: 1 
  Achieved convergence tolerance: 1.280e-11

O primeiro possui dois parâmetros e menor erro residual. O segundo único parâmetro, mas o pior erro residual. Qual é o melhor ajuste?

emanuele
fonte
4
x
3
Excluí minha resposta, que sugeria o uso AIC, porque um comentário fez um caso convincente de que a AIC geralmente não é aplicável para a seleção de nlsataques. Eu sempre tentava decidir um modelo não linear baseado no conhecimento mecanicista, principalmente se o conjunto de dados é tão pequeno quanto o seu.
Roland
1
Hummm. O comentarista original da resposta agora excluída de @ Roland estaria disposto a republicar o comentário? Não é imediatamente óbvio para mim por que o AIC não seria apropriado ... (embora stat.ethz.ch/pipermail/r-help/2010-August/250742.html dê algumas dicas) - e como nota final, se você 're tentando identificar uma transformação de energia, você pode tentar Box-Cox transformationss ( boxcoxno MASSpacote)
Ben Bolker
1
AIC pode ser usado para selecionar modelos.

Respostas:

2

Você pode simplesmente usar o teste F e a anova para compará-los. Aqui estão alguns códigos.

> x <- 1:10
> y <- 2*x + 3                            
> yeps <- y + rnorm(length(y), sd = 0.01)
> 
> 
> m1=nls(yeps ~ a + b*x, start = list(a = 0.12345, b = 0.54321))
> summary(m1)

Formula: yeps ~ a + b * x

Parameters:
   Estimate Std. Error t value Pr(>|t|)    
a 2.9965562  0.0052838   567.1   <2e-16 ***
b 2.0016282  0.0008516  2350.6   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 

Residual standard error: 0.007735 on 8 degrees of freedom

Number of iterations to convergence: 2 
Achieved convergence tolerance: 3.386e-09 

> 
> 
> m2=nls(yeps ~ a + b*x+c*I(x^5), start = list(a = 0.12345, b = 0.54321,c=10))
> summary(m2)

Formula: yeps ~ a + b * x + c * I(x^5)

Parameters:
   Estimate Std. Error  t value Pr(>|t|)    
a 3.003e+00  5.820e-03  516.010   <2e-16 ***
b 1.999e+00  1.364e-03 1466.004   <2e-16 ***
c 2.332e-07  1.236e-07    1.886    0.101    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 

Residual standard error: 0.006733 on 7 degrees of freedom

Number of iterations to convergence: 2 
Achieved convergence tolerance: 1.300e-06 

> 
> anova(m1,m2)
Analysis of Variance Table

Model 1: yeps ~ a + b * x
Model 2: yeps ~ a + b * x + c * I(x^5)
  Res.Df Res.Sum Sq Df     Sum Sq F value Pr(>F)
1      8 0.00047860                             
2      7 0.00031735  1 0.00016124  3.5567 0.1013
>
Estado
fonte
5
Mais informações sobre como interpretar os resultados?
Skan
Por favor, expanda. Com meu conjunto de dados, não recebo saída para o valor F e para Pr (> F). Qual é o sentido de executar as análises anova? Só estou familiarizado com o fato de ele ser usado para comparar categorias e não modelos.
user3386170