Como medir / argumentar a adequação de uma linha de tendência a uma lei de energia?

21

Eu tenho alguns dados nos quais estou tentando ajustar uma linha de tendência. Acredito que os dados sigam uma lei de energia e, portanto, plotamos os dados nos eixos log-log procurando uma linha reta. Isso resultou em uma (quase) linha reta e, no Excel, adicionei uma linha de tendência para uma lei de energia. Sendo um newb de estatísticas, minha pergunta é: qual é agora a melhor maneira de passar de "bem, a linha parece se encaixar muito bem" para "propriedade numérica prova que este gráfico é ajustado adequadamente por uma lei de energia"? x

No Excel, posso obter um valor ao quadrado-r, embora, devido ao meu conhecimento limitado de estatística, nem sei se isso é realmente apropriado nas minhas circunstâncias específicas. Incluí uma imagem abaixo mostrando o gráfico dos dados com os quais estou trabalhando no Excel. Tenho um pouco de experiência com R, portanto, se minha análise estiver sendo limitada por minhas ferramentas, estou aberto a sugestões sobre como melhorá-lo usando R.

texto alternativo

Bryce Thomas
fonte
você pode encontrar algumas idéias aqui freakonometrics.blog.free.fr/index.php?post/2010/09/29/…

Respostas:

24

Veja a página de Aaron Clauset:

que possui links para o código para adequar as leis de energia (Matlab, R, Python, C ++), bem como um artigo de Clauset e Shalizi, que você deve ler primeiro.

Você pode ler primeiro os posts dos blogs de Clauset e Shalizi no jornal:

Um resumo do último link pode ser:

  • Muitas distribuições fornecem linhas retas em um gráfico de log-log.

  • O abuso da regressão linear faz o bebê Gauss chorar.
    Ajustar uma linha ao seu gráfico de log-log por mínimos quadrados é uma má idéia.

  • Use a probabilidade máxima para estimar o expoente de escala.
  • Use a qualidade do ajuste para estimar onde a região de dimensionamento começa.
  • Use um teste de qualidade do ajuste para verificar a qualidade do ajuste.
  • Use o teste de Vuong para verificar alternativas e esteja preparado para a decepção.
ars
fonte
1
Eu segundo isso. Existem muitos exemplos de algo que parecia uma lei de energia, mas, quando examinados um pouco mais rigorosamente, não era .... e não, o alto R ^ 2 no gráfico não é suficiente.
PeterR
"Então você pensa ..." é uma excelente referência. Os pontos 1 a 6 (em 7) abordam diretamente a questão colocada aqui.
whuber
Mas uma distribuição da lei do poder não é a mesma coisa que ajustar um relacionamento da lei do poder entre duas variáveis ​​separadas. Eu assumi que a pergunta era sobre o último, embora não tenha certeza.
onestop 1/10/10
Pergunta de não especialistas: além da "robustez", existem outras razões pelas quais se deve verificar a adequação com Kolmogorov-Smirnov em vez de neste caso? χ2
JM não é estatístico
2
@JM: na verdade não, o qui-quadrado é sensível ao binning e as flutuações da cauda complicam isso. Acho que mesmo com o KS, eles pesam mais a estatística para pontos extremos, e há alguma discussão sobre outros testes. @ onestop: Eu assumi o contrário, e na releitura, você pode estar certo. Eu realmente não tenho certeza .. #
221/10 ars
3

Se você estiver interessado em funções bivariadas da lei do poder (em oposição a distribuições univariadas da lei do poder),

Warton et al. " Métodos de ajuste de linha bivariados para alometria ". Biol. Rev. 81, 259-201 (2006)

é uma excelente referência. Nesse caso, a regressão é a coisa certa a fazer, embora possa haver algumas correções (OLS x RMA, etc.) dependendo do que você deseja que os resultados da regressão signifiquem.


fonte
Aaron - esse link está morto, você poderia postar um novo?
keflavich
Obrigado por isso. A maioria das informações é para distribuições univariadas que tende a enterrar informações sobre as relações bivariadas ... Aqui está um link para o Riley listando onlinelibrary.wiley.com/doi/abs/10.1017/S1464793106007007
Songololo