Número de dígitos significativos a serem relatados

Existe uma maneira mais científica de determinar o número de dígitos significativos a serem relatados para uma média ou um intervalo de confiança em uma situação que é bastante padrão - por exemplo, o primeiro ano de aula na faculdade.

Eu vi Número de figuras significativas para colocar em uma tabela , por que não usamos dígitos significativos e Número de figuras significativas em um quadrado de chi , mas elas não parecem apontar o problema.

Nas minhas aulas, tento explicar aos meus alunos que é um desperdício de tinta relatar 15 dígitos significativos quando eles têm um erro padrão tão amplo em seus resultados - meu pressentimento era que ele deveria ser arredondado para algo da ordem de . Isso não é muito diferente do que é dito pela ASTM - Reporting Test Results referente ao E29, onde eles dizem que deve estar entre e . $0.25\sigma$ $0.05\sigma$ $0.5\sigma$

EDITAR:

Quando tenho um conjunto de números como xabaixo, quantos dígitos devo usar para imprimir a média e o desvio padrão?

set.seed(123)
x <- rnorm(30) # default mean=0, sd=1
# R defaults to 7 digits of precision options(digits=7)
mean(x) # -0.04710376 - not far off theoretical 0
sd(x) # 0.9810307 - not far from theoretical 1
sd(x)/sqrt(length(x)) # standard error of mean 0.1791109

PERGUNTA: Explique detalhadamente qual é a precisão (quando há um vetor de números duplos de precisão) para média e desvio padrão e escreva uma função pedagógica R simples que imprimirá a média e o desvio padrão para o número significativo de dígitos que é refletido no vetor x.

standard-deviation error reporting communication Sean
fonte

Não entendo por que "O número de números significativos para colocar em uma tabela" não aborda completamente a sua pergunta: de que ponto essa pergunta se esquece?

whuber

Gosto da sua resposta para essa pergunta @whuber, mas gostaria de um pouco mais de detalhes.

26412 Sean

Mas detalhes sobre o que? De qualquer forma, parece que sua pergunta é realmente uma duplicata exata dessa e o que você gostaria é ver melhorias nas respostas. Estou correcto? BTW, se você estiver procurando orientação pedagógica, gostaria de apontar para um exemplo (especializado) publicado em gis.stackexchange.com/questions/8650 sobre o relatório de coordenadas geográficas: a idéia é associar os números de dígitos com objetos cujos tamanhos a maioria dos leitores entenderá fácil e intuitivamente. Uma abordagem semelhante pode funcionar bem em outros aplicativos.

whuber

@ whuber sim, você está correto, e eu gosto desse exemplo. Suponho que estou procurando mais detalhes sobre como a precisão está relacionada ao desvio padrão. Por exemplo, em R, x <- rnorm (30); média (x); sd (x) # aqui claramente o sd é de cerca de 1, mas em R a média é impressa por padrão com 7 dígitos de precisão. sd (x) / 30 é de cerca de 0,18. Obrigado

Sean

Em R(assim como em quase todos os softwares), a impressão é controlada por um valor global (consulte options(digits=...)), não por qualquer consideração de precisão.

whuber

Respostas:

O Guia de Incerteza em Medição (GUM) recomenda que a incerteza seja relatada com não mais que 2 dígitos e que o resultado seja relatado com o número de dígitos significativos necessários para torná-la consistente com a incerteza. Consulte a Seção 7.2.2 abaixo

http://www.bipm.org/utils/common/documents/jcgm/JCGM_100_2008_E.pdf

O código a seguir foi minha tentativa de implementar esta recomendação em R. Noe, de que R pode não cooperar com tentativas de manter zeros à direita na saída, mesmo que sejam significativos.

gumr <- function(x.n,x.u) {
  z2 <- trunc(log10(x.u))+1
  z1 <- round(x.u/(10^z2),2)
  y1 <- round(x.n*10^(-z2),2)
  list(value=y1*10^z2,uncert=z1*10^z2)
}

x.val <- 8165.666
x.unc <- 338.9741
gumr(x.val,x.unc)

Tom
fonte

Para completar: > gumr(x.val,x.unc) $value [1] 8170 $uncert [1] 340

rhombidodecahedron

@rhombidodecahedron a incerteza não deveria ter apenas uma figura significativa aqui? 82 ± 3 (× 10²)

jfs 01/01

@jfs a recomendação diz usar dois números significativos na incerteza, não é?

Rhombidodecahedron 1/1

@rhombidodecahedron a resposta diz "não mais que 2" Os critérios no GUM não são claros para mim. A tabela 3 de arxiv.org/pdf/1301.1034.pdf sugere 1 dígito significativo a ser relatado para menos de 7 medições.

JFS

O código de exemplo não segue a regra GUM sugerida. Se val = 8165.666e unc = 338.9741, a medição deve ser relatada como val = 8.17(34)*10^3(não val = 8170com unc = 340o dado), para deixar claro que apenas dois dígitos da incerteza são significativos.

divenex 19/02

Se você mostrar o intervalo de confiança e o valor da estatística, não há problema em fornecer quantos números significativos desejar, pois nesse caso, um grande número de números significativos não implica precisão espúria, pois o intervalo de confiança fornece uma indicação da provável precisão real (um intervalo credível seria melhor). É então essencialmente uma questão de tornar a mesa organizada, concisa e legível, de modo que é improvável que exista uma regra simples que se adapte a todas as ocasiões.

A replicabilidade é importante em estudos científicos; portanto, idealmente, deve ser possível reproduzir os resultados para qualquer número de figuras siginificantes (sejam elas de significado prático ou não). O arredondamento para um número pequeno de números significativos pode reduzir a confiança na replicação de um estudo, pois os erros podem ser mascarados pelo arredondamento dos resultados, portanto, em algumas circunstâncias, é possível que haja desvantagens.

Outro motivo para não ir muito longe é que isso pode impossibilitar que outros estendam seu estudo sem repeti-lo. Por exemplo, posso publicar um artigo que compara vários algoritmos de aprendizado de máquina usando o teste de Friedman, que depende da classificação dos diferentes algoritmos em um conjunto de conjuntos de dados de referência. Se as estatísticas para classificadores individuais em cada conjunto de dados forem fornecidas a vários números significativos, dependendo de seus erros padrão, isso sem dúvida criará muitos vínculos aparentes nas classificações. Isso significa que (i) um leitor / revisor do trabalho não será capaz de replicar o teste de Friedman a partir dos resultados apresentados no trabalho e (ii) outra pessoa não poderá avaliar seu algoritmo nos conjuntos de dados de referência e usar o método Friedman teste para colocá-lo no contexto dos resultados do meu estudo.

Dikran Marsupial
fonte

Certamente qualquer decisão, feita objetiva ou subjetivamente, dependeria fortemente do que você está medindo e da precisão do seu instrumento de medida. Esta última é apenas uma parte da variação observada e nem sempre é fácil discernir ou encontrar evidências existentes. Portanto, suspeito fortemente que não haja uma decisão objetiva e universalmente aplicável. Você apenas tem que usar seu cérebro e fazer o melhor julgamento em cada situação.

DL Dahly
fonte