Como descrever estatísticas em uma frase?

27

Quando comecei a aprender estatística, procedimentos como o teste t, ANOVA, qui-quadrado e regressão linear pareciam ser criaturas muito diferentes. Mas agora percebo que esses procedimentos fazem mais ou menos a mesma coisa. Da mesma forma, valores como variância, resíduos, erro padrão e média também medem mais ou menos a mesma coisa.

Portanto, acho que todos esses procedimentos e valores, e de fato todas as estatísticas, podem ser descritos em apenas uma frase simples:

Qual é o valor esperado e qual é a variação em torno desse valor?

A palavra esperada pode ser substituída por qualquer uma dessas palavras: hipotética, prevista ou central.

Como outras pessoas descreveriam as estatísticas em uma frase?

luciano
fonte
10
@Trynna Esta descrição é muito estreita demais: ela caracteriza única estimativa de ponto. É como descrever a matemática como somando e multiplicando números - o que pode muito bem ser a perspectiva de alguém que estuda aritmética há alguns anos na escola - mas fica muito aquém do que o campo compreende.
whuber

Respostas:

26

A estatística fornece o raciocínio e os métodos para produzir e entender dados.

Associação Americana de Estatística

whuber
fonte
+1 Eu estava tentando criar uma expressão de algo muito próximo dessa noção. Eu acrescentaria algo sobre chegar a conclusões com base em dados, mas não é tão sucinto.
Glen_b -Reinstala Monica
3
Glen @ Você pode dizer que muita reflexão foi colocada nessa caracterização. Eu gosto de tê-lo aqui em algum lugar do nosso site. Isso e uma descrição igualmente expressiva do aprendizado de máquina devem pertencer às nossas páginas de ajuda.
whuber
2
Não sei se concordo com a citação (embora seja uma aspiração adorável). Como epidemiologista, sei que sei coisas sobre o desenho de estudos e a produção de dados e inferência causal em torno dos mesmos, que estão fora do alcance de muitos dos estatísticos excelentes ao meu redor. De fato, a inferência causal sofisticada para gráficos causais recursivos se originou em três campos não nomeados estatísticos (epidemiologia, ciência da computação e sociologia, como eu a entendo). Não levantando isso com um espírito belicoso, mas porque a frase citada descreve grande parte da ciência e não estabelece estatísticas por si só .
Alexis
3
A descrição da ASA é muito mais sobre estatística como um domínio do conhecimento e da atividade humana, não indicando quem pode ser um "estatístico". Até os estatísticos profissionais da Segunda Guerra Mundial eram uma raridade, mas isso não significa que as estatísticas não estavam sendo aplicadas em ambientes comerciais e acadêmicos. Não acho que uma boa definição de estatística possa se limitar ao que os estatísticos profissionais fazem.
Silverfish
11
@ Alexis Talvez haja alguma dificuldade com o nível de entendimento implícito na palavra "entendimento", que a definição da ASA deixa bastante ambígua em sua brevidade. Uma interpretação mais ampla pode ser abrangente. Certamente, se incluirmos interpretação física ou social substantiva e mecanismos subjacentes como parte do "entendimento", isso vai além da "mera" estatística. Por outro lado, não está claro para mim por que a inferência de dados, causal ou não, não pode estar nos domínios do esforço científico e estatístico.
Silverfish
13

A estatística preocupa-se fundamentalmente com o entendimento da estrutura nos dados.

Bill Venables e Brian Ripley, primeira frase do capítulo 1 da estatística moderna aplicada com S

mark999
fonte
11
Esta é uma visão interessante das estatísticas, embora limitada. As possíveis ambiguidades são reveladoras: um cientista da computação entenderia a "estrutura de dados" de uma maneira não estatística. (Venables e Ripley trabalham na interseção de estatística e computação.)
whuber
@whuber eu concordo com você. Não há nada que sugira que a V&R pretendesse que fosse uma descrição de uma frase de todas as estatísticas, mas desde que a li pela primeira vez, achei que era uma boa descrição. Interpreto "estrutura nos dados" como "características da população da qual a amostra foi retirada".
mark999
10

As estatísticas fornecem o raciocínio e os métodos para converter dados em informações significativas.

IrishStat
fonte
8

Nas palavras do falecido Leo Breiman:

Os objetivos nas estatísticas são usar dados para prever e obter informações sobre o mecanismo de dados subjacente.

http://projecteuclid.org/euclid.ss/1009213726

Richard Border
fonte
5

Pessoalmente, gosto da seguinte citação de Stephen Senn em Dicing with death. Chance, Risco e Saúde (Cambridge University Press, 2003). Eu destaquei uma frase (ou duas) que, acredito, resume seu ponto principal, embora valha a pena ler todo o parágrafo.

As estatísticas são e as estatísticas são.
A estatística, singular, contrária à percepção popular, não é realmente sobre fatos; é sobre como sabemos, suspeitamos ou acreditamos que algo é um fato. Porque conhecer as coisas envolve contá-las e medi-las, é verdade que as estatísticas plurais fazem parte da preocupação das estatísticas singulares, que é a ciência do raciocínio quantitativo. Essa ciência tem muito mais em comum com a filosofia (em particular a epistemologia) do que com a contabilidade. Estatísticos são filósofos aplicados. Os filósofos argumentam quantos anjos podem dançar na cabeça de uma agulha; os estatísticos os contam . Ou melhor, conte quantos provavelmente podem dançar.A probabilidade é o cerne da questão, o cerne de toda a matéria, se se puder acreditar nos físicos quânticos. Para o estatístico, isso é verdade, se o mundo é estritamente determinístico como Einstein acreditava ou se existe uma indeterminação residual inelutável. Não podemos prever nada com certeza, mas podemos prever o quão incertas nossas previsões serão, em média. Estatística é a ciência que nos diz como.

chl
fonte
5

Estatística é a ciência de aprender com dados e medir, controlar e comunicar incertezas.

Marie Davidian e Thomas Louis

Eles continuam:

; e, portanto, fornece a navegação essencial para controlar o curso dos avanços científicos e sociais

Momo
fonte
Gosto dessa definição porque destaca o aspecto "incerteza". A segunda parte é boa porque diz que a estatística não existe apenas por si só, mas deve ser vista em um contexto mais amplo. Para estar completamente satisfeito, no entanto, talvez eu mesclasse isso com o ASA:
Momo
11
A estatística como a ciência de aprender com os dados e medir, controlar e comunicar a incerteza fornece o raciocínio e os métodos para produzir e entender os dados.
Momo
2

A estatística é um conjunto de métodos e modos de pensamento que ajudam as pessoas a tirar conclusões claras a partir de informações barulhentas.

Michael Lew
fonte
2

Como não somos uma criatura onisciente e divina, temos que lidar com a incerteza e o Statistics fornece métodos para incorporar e refletir essa incerteza.

elevendollar
fonte
2

estatística é um subcampo da filosofia que lida com a seguinte pergunta 'como aprendemos com as observações' usando conceitos matemáticos rigorosos.

apenas uma nota lateral de que você pode fazer 'uma frase' muito longa; há um livro escrito por B. Hrabal que consiste em uma frase longa, veja: Lições de dança para os mais avançados na era

pes
fonte
2

Estatística é a ciência da incerteza e a tecnologia de extrair informações dos dados

David J. Hand

Momo
fonte
2

Estatística é um conjunto de princípios lógicos e métodos matemáticos para resumir informações quantificadas de maneira precisa e relevante.

SQLServerSteve
fonte
1

Nas minhas próprias palavras

Statistics is the science of what might be

Isso é meio que irônico .

MCP_infiltrator
fonte
11
Se você mascarasse a primeira palavra e pedisse às pessoas que preenchessem o espaço em branco, suspeito que "estatísticas" não seriam a primeira coisa que elas apareceriam - e talvez não a segunda ou a terceira também. "Futurologia", "especulação", "ficção científica" e talvez - ficando um pouco mais perto de sua intenção - "previsão" e "previsão" - provavelmente seriam escolhas populares. Até a "oneirologia" e o "apotropaismo" seriam possibilidades. :-)
whuber
1

Fisher ( 1922 ) deu sua opinião sobre a essência das estatísticas na seguinte citação (fonte em negrito adicionada por mim para o requisito de uma frase ):

Para chegar a uma formulação distinta de problemas estatísticos, é necessário definir a tarefa que o estatístico se propõe: brevemente, e em sua forma mais concreta, o objeto dos métodos estatísticos é a redução de dados . Uma quantidade de dados, que geralmente por sua mera massa é incapaz de entrar na mente, deve ser substituída por relativamente poucas quantidades que devem representar adequadamente o todo ou que, em outras palavras, devem conter o máximo possível, idealmente o todo , das informações relevantes contidas nos dados originais.

ekvall
fonte
0

Uma linha orientada a resultados (e não muito descritiva ) seria, para mim,

A estatística é o que faz o mundo humano girar, independentemente do que faz o mesmo com a natureza.

Alecos Papadopoulos
fonte
3
Você está confundindo estatísticas com política? Ou talvez com amor?
whuber
@whuber (+1) Não. Ambos tomam a maioria de suas decisões com base nas estatísticas, independentemente de perceberem ou não.
Alecos Papadopoulos
2
Eu posso ver isso agora, em um próximo filme, quando o protagonista masculino se ajoelha para propor: "Baby, você é minha UMVUE, quer se casar comigo?" :-) (Vamos usar um estimador de encolhimento e trazer os nossos coeficientes juntos ...)
whuber
@whuber (+2) ... esta é a parte "não percebe": é exatamente isso que significa o líder masculino , mesmo que ele não use a linguagem! (Eu admito que posso ser culpado do imperialismo filosófico aqui).
Alecos Papadopoulos
2
Sua formação cultural profundamente respeitável (na medida em que seu nome e localização permitem inferir isso), que podemos remontar pelo menos aos primeiros sofistas, permite uma certa latitude a esse respeito. :-)
whuber
0

A estatística é uma ferramenta para modelar a geração de dados por processos incertos e / ou probabilísticos.

thecity2
fonte
-1

As estatísticas tratam de torturar dados por tempo suficiente até que confessem o que você deseja mostrar.

Estou parafraseando Ronald Coase, veja o link

xeon
fonte
-1, isso foi planejado como língua na bochecha?
gung - Restabelece Monica
@ gung sim e não, eu estava citando Ronald Coase.
Vladislavs Dovgalecs 05/03
3
Com base na versão aqui , é na melhor das hipóteses uma paráfrase ruim. Esse não é um bom resumo de uma frase do que são estatísticas.
gung - Restabelece Monica
3
@gung bem, o OP perguntou como pessoas diferentes o descreveriam. Será sempre o seu ponto de vista ou opinião. Será diferente para pessoas diferentes. OP tentou reunir opiniões diferentes IMHO.
Vladislavs Dovgalecs 05/03
2
xeon, seria uma grande gentileza para Coase editar sua resposta para citar e obter a atribuição adequadamente.
Alexis
-2

Estatística é a ciência matemática que permite descobrir se a diferença entre conjuntos de observações é aleatória ou não.

Sympa
fonte
11
Descreve um subconjunto restrito do que é o campo.
Rolando2
Eu vejo diferente. Por fim, se você está realizando testes de hipóteses, modelagem de regressão ou qualquer outra estimativa, você sempre mede se a diferença entre sua estimativa e um modelo ingênuo ou a diferença nas observações são estatisticamente significativas ou não. Minha frase captura a essência da significância estatística versus aleatoriedade. Se outros concordarem, você pode me dar alguns votos positivos, então meu comentário que é facilmente justificável não é tratado como uma resposta errada e clara apenas por causa da interpretação subjetiva de estreiteza de um indivíduo.
Sympa
2
considere estes tipos de perguntas que muitas vezes se procura responder usando estatísticas: Qual é o formato dessa distribuição? Qual é a natureza do relacionamento entre essas duas variáveis? Como essas muitas variáveis ​​podem ser agrupadas para que possamos ver os problemas / temas / tópicos / dimensões comuns? Como esses muitos casos podem ser agrupados para que possamos ver os tipos / perfis comuns? Qual é a melhor maneira de descrever essa rede de relacionamentos visando a causalidade? O que captura a tendência dessa variável ao longo do tempo? Qual é a melhor maneira de prever valores futuros?
Rolando2
Em cada um desses casos, a resposta a essas perguntas tem um forte elemento de significância estatística e se o que você está vendo de qualquer forma ou forma é diferente do que poderia ocorrer por pura aleatoriedade. Para a maioria de nós, um voto negativo significa uma resposta explicitamente errada. Não vejo como minha resposta pode ser categorizada como tal.
Sympa
11
O texto suspenso sobre a seta de votação negativa indica "esta resposta não é útil". Acho isso interessante - e, portanto, não é inútil - porque é instigante, mas não o votei por várias razões. A primeira é a afirmação de que estatísticas é uma "ciência matemática": que se aproxima desconfortavelmente do equívoco (especialmente entre certos matemáticos) de que estatísticas é apenas um ramo da matemática. A segunda é que parece apenas caracterizar o teste de hipóteses de duas amostras, que é uma parte muito estreita (embora difundida) das estatísticas.
whuber