Relatar resultados de ajuste de curva em um artigo científico

11

(Espero que esta pergunta se encaixe neste site; caso contrário, aceite minhas desculpas).

Fiz uma certa simulação e obtive uma série temporal y (t), t = 0, 1, ... 20. Depois de tentar algumas funções, descobri que:

y(t) =~ 1 / (A t + B)

Onde A e B são coeficientes calculados usando regressão linear, com R ^ 2> 0,99.

Qual é a maneira padrão de relatar esses resultados em um artigo científico? Especificamente:

R. Não tenho explicação teórica, por que a saída se parece com isso (eu sei que deveria estar diminuindo e que é delimitada por baixo, mas não muito mais). Foi apenas um palpite de sucesso. Devo descrever todos os outros palpites malsucedidos que tentei?

B. Sempre que executo a simulação, obtenho valores ligeiramente diferentes de A e B. Devo relatar uma execução aleatória ou devo executar a simulação muitas vezes e calcular a média dos resultados? Se sim, quantas vezes é suficiente?

Erel Segal-Halevi
fonte
O que você quer transmitir? O que cada simulação individual representa?
Bill Barth
É uma simulação da propriedade da terra. Existem N cidadãos e N lotes de terra. Inicialmente, cada lote é entregue a um cidadão aleatório. Então, a cada ano, cada terreno é vendido com uma certa probabilidade p e, se é realmente vendido, o comprador é selecionado aleatoriamente. Após 50 anos, executo um procedimento de "Jubileu", em que algumas terras são devolvidas aos proprietários originais, se esses proprietários atualmente não tiverem terras. Eu medo o número de cidadãos sem terra (y) após cada Jubileu (t). Certamente y (t) não aumenta. Eu quero mostrar que ele está diminuindo em uma taxa previsível, e que converge para 0.
Erel Segal-Halevi
AB
2
xnn=0Nn
Bill: você quer dizer que eu deveria calcular A e B muitas vezes e depois relatar a média e o padrão? Eu acho que uma abordagem melhor é fazer uma única regressão linear com todas as amostras de todas as simulações. Mas quantas vezes devo executar a simulação?
Erel Segal-Halevi

Respostas:

5

Você está tentando ajustar uma lei de energia à sua distribuição. Muito interessante. Eles aparecem o tempo todo na teoria dos grafos , nas redes sociais e em muitos outros lugares.

Existem alguns tutoriais sobre como ajustar seus dados aqui e aqui .

Além disso, em referência à pergunta A., como a probabilidade de uma pessoa comprar terras depende da quantidade de terras que já possui? Você pode usar o modelo de Barbasi para explicar por que uma lei de energia é um ajuste razoável aos seus dados.

atualização: usei isso e funciona muito bem: https://pypi.python.org/pypi/powerlaw

dranxo
fonte
+1 para todos os links! Também pensei em lei do poder, mas sua forma simples (y = A t ^ k) não implica a forma que encontrei, devido à constante B (y = (A t + B) ^ - 1). Existe uma forma mais geral?
precisa saber é o seguinte
Se você estiver interessado em descrever o formato da curva, deve fatorar e mudar antes de aplicar uma lei de potência. O fato de você ter um B não é relevante para o formato da curva.
dranxo
Desculpe, eu não entendi você, o que você quer dizer com "então você deve fatorar e mudar"?
Erel Segal-Halevi
Defina x = t + B / A. Então (At + B) ^ {- 1} = (A * x) ^ {- 1}, que é o formulário nos links.
dranxo
1
tuvalu.santafe.edu/~aaronc/courses/7000/csci7000-001_2011_L3.pdf
dranxo
7

Algumas reflexões sobre sua pergunta:

  • Como você relata o ajuste do seu modelo dependerá muito do seu público e do seu campo. Por exemplo, no meu campo, estatísticas de ajuste de modelo como R ^ 2 são raramente relatadas - consideradas nem impressionantes nem particularmente úteis. Em vez disso, alguns critérios de como você chegou ao modelo em que chegou tendem a ser descritos e, em seguida, você relata os resultados do modelo - todos assumimos que você realmente se encaixa no modelo corretamente.
  • "Eu encontrei este formulário" é uma explicação ruim. Muito ruim. Apesar de gostar de histórias de gênio acidental, como a descoberta da penicilina ou do quinino, a "sorte cega" não é um processo científico confiável. Por exemplo, você mostrou que esse formulário é bom para ajustar seus dados, mas ainda não mostrou que é melhor para ajustar seus dados. R ^ 2 por si só não é uma métrica suficiente para avaliar quão bem seu modelo se ajusta aos dados. Veja o quarteto de Anscombe .
  • Como a @rcompton mencionou, parece que você está tentando ajustar uma distribuição da lei de energia sem conhecê-la, mas mesmo se você conseguir se encaixar bem em uma lei de energia, é realmente melhor se você encontrar algum motivo para pensar que é uma lei de energia . Pode ser o suficiente para traçar Y com o tempo, ir para o CrossValidated (ou uma faculdade / departamento mais confortável com as estatísticas) e repassar sistematicamente distribuições que podem dar a você essa aparência. Além da distribuição da lei de energia, há outras que podem lhe proporcionar um ajuste superior.
Fomite
fonte
+1 para as informações. "repasse sistematicamente distribuições que podem lhe dar mais ou menos essa aparência". - onde posso encontrar isso?
Erel Segal-Halevi
@ErelSegalHalevi Você pode começar pelo CrossValidated, site irmão que se refere a estatísticas e análise de dados.
fomite