Acabei de realizar uma regressão linear (muito) simples em Genstat e gostaria de incluir um resumo sucinto e significativo da saída no meu relatório. Não sei exatamente o que ou quanto das informações devo incluir.
Os principais bits da minha saída Genstat são assim:
Summary of analysis
Source d.f. s.s. m.s. v.r. F pr.
Regression 1 8128935. 8128935. 814.41 <.001
Residual 53 529015. 9981.
Total 54 8657950. 160332.
Percentage variance accounted for 93.8
Standard error of observations is estimated to be 99.9.
Estimates of parameters
Parameter estimate s.e. t(53) t pr.
Constant 41.5 30.7 1.35 0.182
UKHR_Ref 0.8659 0.0303 28.54 <.001
Pretendia relatar isso simplesmente como:
Adjusted R2 = 0.94 (slope = 0.87, p < 0.001; intercept not significantly different from 0).
mas um colega sugeriu que eu também incluísse pelo menos o root mean squared error
(que acredito que neste caso seja igual ao erro padrão das observações, isto é, 99,9?).
A inclusão do RMSE fornece informações úteis adicionais ou a qualidade do ajuste já está adequadamente explicada pelo valor de R2 ajustado?
Existem regras rígidas e rápidas para quanta informação reportar ou é bastante subjetiva?
Muito obrigado!
fonte
Respostas:
Para uma regressão linear simples, eu sempre produzia um gráfico da variável x em relação à variável y, com a linha de regressão sobreposta ao gráfico (sempre plote seus dados sempre que possível!). Isso mostrará com muita facilidade o quão bem o seu modelo se encaixa e é fácil de ler para uma regressão de 1 variável. Adicionar isso ao que você já tem provavelmente seria suficiente, embora você possa incluir alguns gráficos de diagnóstico (alavancagem, distância de cozimento, resíduos, etc.). Depende de quão bom é o enredo xy, do público-alvo e de quaisquer protocolos esperados pelo público.
fonte
Utilizo para relatar o coeficiente β mais o IC95%, o valor de p e o Rsquared ajustado. Ex:
Ao relatar uma regressão múltipla ou uma regressão com variáveis fatoriais, relato o coeficiente, o IC de 95%, os valores de p e, em seguida, separadamente as estatísticas F (degres de liberdade), o R2 ajustado e o valor de p do modelo.
fonte