Estatísticas não é matemática?

20

Estatísticas é matemática ou não?

Dado que são todos os números, principalmente ensinados pelos departamentos de matemática e você recebe créditos por isso, me pergunto se as pessoas apenas falam de brincadeira quando dizem isso, como dizer que é uma parte menor da matemática ou apenas matemática aplicada.

Gostaria de saber se algo como estatística, onde você não pode construir tudo sobre axiomas básicos, pode ser considerado matemática. Por exemplo, o valor- , que é um conceito que surgiu para dar sentido aos dados, mas não é uma consequência lógica de princípios mais básicos.p

Quora Feans
fonte
10
Referência obrigatória do XKCD: xkcd.com/435 . Enfim, isso realmente importa?
Nico 04/12
2
(i) Como quantificaríamos essas coisas? Não é como se tivesse sido objeto de uma pesquisa! (ii) Os cálculos quase sempre envolvem números, mas o que a torna estatística , em minha opinião, geralmente não está nos cálculos . (iii) Quando fiz meu curso de estatística em graduação, ele não estava no departamento de matemática. O lugar em que fiz meu doutorado - sob dois estatísticos bastante conhecidos - também não era um departamento de matemática. (iv) não acho que seja uma piada. Está relacionado a uma idéia muito importante - que o que faz da estatística "estatística" é mais uma maneira de raciocinar sobre tipos específicos de problemas.
Glen_b -Reinstala Monica
6
Sinto-me obrigado a dar uma resposta curta, pois sou ex-matemático puro (PhD e 3,5 anos de pós-doutorado em algum tipo de álgebra) e agora um estatístico aplicado ... bem, o tipo de estatísticas que você aprende para estatísticas aplicadas, como " quando uso um teste "ou não, para um matemático, parece um livro de receitas, não uma matemática. Mas, por exemplo, a estatística assintótica de van der Vaart é definitivamente um livro de matemática ... Existem muitos níveis intermediários - alguns deles não são bem preenchidos, acho que não há livros suficientes explicando estatísticas com muitos exemplos reais e todos os aspectos matemáticos detalhes. t
Elvis
5
Não sei o que fazer com a afirmação "o valor , que é um conceito que surgiu para dar sentido aos dados, mas não é uma consequência lógica de princípios mais básicos", nem tenho certeza se pode realmente estar certo ou errado. Parece principalmente proceder de premissas confusas. p
gung - Restabelece Monica
12
Por analogia, poderíamos caracterizar a química (outra "disciplina matemática") como teoria da distribuição assintótica e álgebras C *. Fazer isso é nominalmente preciso, mas perde completamente a essência do que é a química e seus objetivos que nenhum químico a reconheceria. Da mesma forma, compare sua caracterização com o que as principais sociedades profissionais dizem ser estatística : elas são mundos separados. "A ciência de aprender com os dados e de medir, controlar e comunicar incertezas." Nenhuma menção de probabilidade lá.
whuber

Respostas:

15

A matemática lida com abstrações idealizadas que (quase sempre) têm soluções absolutas, ou o fato de que essa solução não existe geralmente pode ser descrito completamente. É a ciência de descobrir conseqüências complexas, mas necessárias, de axiomas simples.

A estatística usa matemática, mas não é matemática. É uma adivinhação educada. É jogo.

A estatística não lida com abstrações idealizadas (embora use algumas como ferramentas), lida com fenômenos do mundo real. As ferramentas estatísticas geralmente fazem suposições simplificadoras para reduzir os confusos dados do mundo real para algo que se encaixa no domínio do problema de uma abstração matemática resolvida. Isso nos permite fazer suposições bem-educadas, mas isso é realmente tudo o que as estatísticas são: a arte de fazer suposições muito bem informadas.

Considere o teste de hipóteses com valores-p. Digamos que estamos testando alguma hipótese com significância e, após a coleta de dados, encontramos um valor-p de 0,001 . Portanto, rejeitamos a hipótese nula em favor de uma hipótese alternativa.α=0,010,001

Mas qual é esse valor p realmente? Qual é o significado? Nossa estatística de teste foi desenvolvida de modo a estar em conformidade com uma distribuição específica, provavelmente o t do aluno. Sob a hipótese nula, o percentil de nossa estatística de teste observada é o valor p. Em outras palavras, o valor p dá a probabilidade de obtermos um valor tão longe da expectativa da distribuição (ou mais) quanto a estatística de teste observada. O nível de significância é um ponto de corte bastante arbitrário: configurá-lo para equivale a dizer: "é aceitável se 1 em 100 repetições deste experimento sugerir que rejeitemos o nulo, mesmo que o nulo seja de fato verdadeiro. "0,01

O valor p nos dá a probabilidade de observarmos os dados disponíveis, uma vez que o nulo é verdadeiro (ou melhor, ficando um pouco mais técnico, que observamos os dados sob a hipótese nula que nos dá um valor pelo menos tão extremo quanto o estatística testada como a que encontramos). Se vamos rejeitar o nulo, queremos que essa probabilidade seja pequena, se aproxime de zero. Em nosso exemplo específico, descobrimos que a probabilidade de observar os dados que coletamos se a hipótese nula fosse verdadeira era de apenas ; portanto, rejeitamos o nulo. Este foi um palpite. Nós nunca realmente sabe com certeza que a hipótese nula é falsa usando esses métodos, nós apenas desenvolver uma medida de como fortemente nossa evidência suporta a alternativa.0,1%

Usamos matemática para calcular o valor de p? Certo. Mas a matemática não nos deu a nossa conclusão. Com base nas evidências, formamos uma opinião educada, mas ainda é uma aposta. Descobrimos que essas ferramentas são extremamente eficazes nos últimos 100 anos, mas as pessoas do futuro podem se horrorizar com a fragilidade de nossos métodos.

David Marx
fonte
6
O valor p não é a probabilidade de estarmos errados quando rejeitamos a hipótese nula, pois isso também depende de H1, que não entra no cálculo do valor p (bem ilustrado por i.stack.imgur.com/tStr4 .png - a probabilidade de H0 estar errado e de o sol explodir é bem menor que p = 1/36).
Dikran Marsupial
Você poderia sugerir uma melhor interpretação de linguagem simples do valor-p? "A probabilidade de observarmos os dados em mãos, dado o nulo, é verdadeira", talvez? Eu já mergulhei muito mais fundo no exemplo do valor-p do que pretendia. Minha intenção era enfatizar as estatísticas, não fornecer um tutorial sobre como interpretar valores-p. Eu não quero ficar muito descarrilado. Obrigado por apontar isso, em qualquer caso.
David Marx
2
O valor p é a probabilidade de um resultado pelo menos tão extremo quanto o observado se a hipótese nula for verdadeira. O ponto em que o elo entre a plausibilidade da hipótese nula e o valor p sendo amplamente subjetivo, e não uma necessidade lógica, é um bom ponto (+1). Ultimamente, tenho me perguntado se o teste de hipóteses freqüentista é menos subjetivo do que a abordagem bayesiana, onde pelo menos a subjetividade se torna mais explícita.
Dikran Marsupial
Não está claro para mim como sua interpretação / definição de valor-p difere da alternativa que eu ofereci no meu último comentário. Certamente há um certo grau de subjetividade nos testes de hipóteses freqüentes, mas é o mesmo tipo de subjetividade que é invocado ao interpretar um fator de Bayes. E não é como se o nível de significância não fosse comunicado (ou seja, a subjetividade seja explicitada aqui também), é geralmente escolhido com base na convenção, enquanto geralmente há mais reflexão na escolha de priores Bayesianos (informativos).
David Marx
1
@ David: O "pelo menos tão extremo" faz uma grande diferença - a probabilidade do valor observado sob o nulo geralmente não é o valor p, mesmo para estatísticas discretas de teste, quando isso faz sentido. Eu sei que é tangencial ao ponto que você estava falando, mas se a Wikipedia conseguir fazer o certo, poderemos fazer o Cross Validated.
Scortchi - Reinstate Monica
10

Língua firmemente na bochecha:

Einstein aparentemente escreveu

Na medida em que as leis da matemática se referem à realidade, elas não são certas; e na medida do certo, eles não se referem à realidade.

então a estatística é o ramo da matemática que descreve a realidade. ; o)

Eu diria que a estatística é um ramo da matemática da mesma maneira que a lógica é um ramo da matemática. Certamente inclui um elemento da filosofia, mas não acho que seja o único ramo da matemática em que esse seja o caso (ver, por exemplo, Morris Kline, "Matemática - A perda de certeza", Oxford University Press, 1980).

Dikran Marsupial
fonte
2
A lógica é um ramo da matemática? Incluindo lógicas de três valores e lógicas modais, ou apenas cálculo de predicado de primeira ordem? Todas as ciências formais são de alguma forma matemática?
Scortchi - Restabelece Monica
Eu consideraria o estudo de qualquer sistema de manipulação de símbolos de acordo com um conjunto de regras (por exemplo, linguagens formais) uma variedade de matemáticas; portanto, suponho que sim. O problema dos rótulos é que eles nem sempre são totalmente descritivos de tudo ao qual são aplicados (eu não diria que fui exatamente um matemático, estatístico ou cientista da computação, mas tenho alguns aspectos dos três). Da mesma forma, a mesma coisa pode ser colocada em mais de uma hierarquia, portanto, talvez não exista uma solução única para a questão!
Dikran Marsupial
Por seu argumento, a estatística, como descrição da realidade, também compreende geometria e teoria quântica de campos, mas não inclui teste de hipóteses (porque a maioria das hipóteses é contra-factual - elas pretendem ser falsificadas - e, portanto, claramente não "descreva a realidade").
whuber
A citação de Einstein era a língua na bochecha e não era para ser levada a sério; Tenho certeza de que não é bem o que Einstein realmente tinha em mente!
Dikran Marsupial
5

Bem, se você diz que " algo como estatística, onde você não pode construir tudo sobre axiomas básicos ", provavelmente deveria ler sobre a teoria axiomática da probabilidade de Kolmogorov. Kolmogorov define probabilidade de uma maneira abstrata e axiomática, como você pode ver neste pdf na página 42 ou aqui na parte inferior da página 1 e nas próximas páginas .

Apenas para dar uma amostra de suas definições abstratas, ele define uma variável aleatória como uma função 'mensurável', conforme explicado de uma maneira mais 'intuitiva': se uma variável aleatória é uma função, como definir uma função de uma variável aleatória? variável aleatória

Com um número muito limitado de axiomas e usando resultados da teoria das medidas (novamente matemática), ele pode definir conceitos como variáveis ​​aleatórias, distribuições, probabilidade condicional ... de maneira abstrata e obter todos os resultados conhecidos, como a lei dos grandes números, ... deste conjunto de axiomas. Aconselho você a experimentá-lo e ficará surpreso com a beleza matemática disso.

Para uma explicação sobre os valores-p, refiro-me a: Entendendo mal um valor-P?

user83346
fonte
1
Ainda não existe uma distinção importante entre a Teoria da Probabilidade (Matemática) e sua aplicação aos problemas de inferência (Estatística)? As abordagens bayesiana e freqüentista mostram o mesmo aparato matemático ( tipicamente ou quase ) usado com conceitos bastante diferentes de probabilidade.
Scortchi - Reinstate Monica
@ Scortchi: Não tenho certeza se os conceitos de probabilidade são diferentes para frequentistas e bayesianos; veja stats.stackexchange.com/questions/230415/…
Não vejo nenhuma discordância entre meu comentário e sua resposta para Existe alguma base matemática para o debate bayesiano x freqüentador? . Por "aparato matemático", quero dizer o que se segue dos axiomas de Kolmogorov; por "conceitos" entendo as interpretações como freqüência limitadora, grau de crença, etc.
Scortchi - Restabelece Monica
3

Não tenho uma base rigorosa ou filosófica para responder a isso, mas ouvi a queixa de "estatísticas não é matemática" frequentemente de pessoas, geralmente tipos de física. Acho que as pessoas querem garantir certeza de suas contas, e a estatística (geralmente) oferece apenas conclusões probabilísticas com valores de p associados. Na verdade, é exatamente isso que eu amo nas estatísticas. Vivemos em um mundo fundamentalmente incerto e fazemos o melhor que podemos para entendê-lo. E fazemos um ótimo trabalho, considerando tudo.

Jordânia
fonte
2

Talvez seja porque eu sou um plebe e não fiz nenhum curso avançado de matemática, mas não vejo por que estatística não é matemática. Os argumentos aqui e em uma pergunta duplicada parecem argumentar dois pontos principais sobre o motivo pelo qual a estatística não é matemática * .

  1. Não é exato / certo e, como tal, se baseia em suposições.
  2. Aplica matemática a problemas e sempre que você aplica matemática, não é mais matemática.

Não é exato e usa suposições

Pressupostos / aproximações são úteis para muita matemática.

As propriedades de um triângulo que eu aprendi na escola são consideradas verdadeiras matemáticas, mesmo que não sejam verdadeiras na geometria não elucidiana. Tão claramente a admissão dos limites, ou declarado de outra maneira "assumindo que XYZ é válido", para um ramo da matemática não desqualifica o ramo de ser "verdadeiro".

Cálculo, tenho certeza, seria considerado uma forma pura de matemática, mas os limites são a ferramenta principal em que a construímos. Podemos continuar calculando até o limite, da mesma forma que podemos continuar aumentando o tamanho da amostra, mas também não aumentamos o insight após um certo limite.

Depois de aplicar matemática, não é matemática

A contradição óbvia aqui é que usamos a matemática para provar teoremas matemáticos, e ninguém argumenta que provar teoremas matemáticos não é matemática.

A próxima afirmação pode ser que thing xnão é matemática se você usar matemática para obter um resultado. Isso também não faz sentido.

A afirmação com a qual eu concordo é que, quando você usa os resultados de um cálculo para tomar uma decisão, a decisão não é matemática . Isso não significa que a análise que leva à decisão não seja matemática .

Acho que quando usamos análise estatística toda a matemática realizada é matemática real. Somente quando entregamos os resultados a alguém para interpretação, as estatísticas saem da matemática. Assim, estatísticas e estatísticos estão realizando matemática e são matemáticos reais. É a interpretação feita pelo negócio e / ou a tradução dos resultados para o negócio pelo estatístico que não é matemática.

Dos comentários:

whuber disse:

Se você substituísse "estatística" por "química", "economia", "engenharia" ou qualquer outro campo que emprega matemática (como a economia doméstica), parece que nenhum dos seus argumentos mudaria.

Penso que a principal diferença entre "química", "engenharia" e "equilibrar meu talão de cheques" é que esses campos usam apenas conceitos matemáticos existentes . Entendo que estatísticos como Guass expandiram o corpo de conceitos matemáticos. Acredito (isso pode estar descaradamente errado) que, para obter um PhD em estatística, você precisa contribuir, de alguma forma, para expandir o corpo de conceitos matemáticos. Os candidatos a doutorado em Química / Engenharia não têm esse requisito para meu conhecimento.

A distinção de que a estatística contribui para o corpo dos conceitos matemáticos é o que a diferencia dos outros campos que apenas usam conceitos matemáticos .


*: A exceção notável é esta resposta que afirma efetivamente que os limites são artificiais devido a várias razões sociais. Eu acho que é a única resposta verdadeira, mas onde está a graça nisso? ;)

Erik
fonte
1
Se você substituísse "estatística" por "química", "economia", "engenharia" ou qualquer outro campo que emprega matemática (como a economia doméstica), parece que nenhum dos seus argumentos mudaria. Como tal, parece estar sem qualquer substância.
whuber
Os doutores em estatística não precisam "contribuir para o corpo de conceitos matemáticos". A maioria dos PhDs em estatística é concedida por contribuições à metodologia estatística e teoria estatística . (Poucos matemáticos, se houver, prestam atenção à literatura estatística. Simplesmente não é uma boa fonte de idéias matemáticas novas ou frutíferas em geral. Não estou me referindo à literatura na teoria das probabilidades aqui.) Além disso, químicos, engenheiros, físicos etc. geralmente criam (ou, geralmente, recriam) idéias matemáticas em seu trabalho; isso não transforma automaticamente seus campos em ramos da matemática.
whuber
@ whuber Isso é muito interessante. Parece que eu não tenho uma perna para me apoiar.
Erik
1
Para que conste, não diminui a sua contribuição. Este é um tópico delicado para muitos - por exemplo, muitos departamentos de matemática da faculdade ainda estão tentando tratar estatísticos como matemáticos, em detrimento de ambos - e, portanto, é provável que provoque fortes reações.
whuber
2
@whuber Eu sou forte o suficiente para suportar alguns votos negativos, independentemente. :) Eu acho que você era respeitoso o tempo todo, então não se preocupe com isso. Além de votar é anônimo por uma razão. Não há necessidade de gravar.
Erik
2

Testes estatísticos, modelos e ferramentas de inferência são formulados na linguagem da matemática, e os estatísticos provaram matematicamente livros espessos de resultados muito importantes e interessantes sobre eles. Em muitos casos, as provas fornecem evidências convincentes de que as ferramentas estatísticas em questão são confiáveis ​​e / ou poderosas.

A estatística e sua comunidade podem não ser "puras" o suficiente para matemáticos de um certo gosto, mas definitivamente são investidas em matemática de maneira extremamente profunda, e a estatística teórica é tanto um ramo da matemática quanto a física teórica ou a ciência da computação teórica.

Paulo
fonte
2
Olá Paul, como você diz, as estatísticas estão cheias de bons teoremas e provas (+1), existe até uma teoria axiomática da probabilidade, desenvolvida por Kolmogorov, como explico na minha resposta.
-2

A "diferença" se baseia em: raciocínio indutivo vs. raciocínio dedutivo vs. inferência. Por exemplo, nenhum teorema matemático pode dizer qual distribuição ou anterior você pode usar para seus dados / modelo.

A propósito, as estatísticas bayesianas são uma área axiomatizada.

Compay Segundo
fonte
Matemática precisa raciocínios indutivo também ...
Elvis
@Elvis Sim, é por isso que o meu exemplo ... Eu tenho certeza que você sabe não há uma resposta geral para esta pergunta ... Eu editei a resposta, para o seu prazer ...
Compay Segundo
Eu realmente não entendo o seu ponto.
Elvis
@CompaySegundo: Não sei se você tem um ponto válido aqui, pelo menos, não está claramente indicado.
Quora Feans
1
@QuoraFea Provavelmente eu sou apenas muito bêbado ...
Compay Segundo
-2

Essa pode ser uma opinião muito impopular, mas, dada a história e a formulação de conceitos de estatística (e teoria das probabilidades), considero a estatística um sub-ramo da física .

De fato, Gauss formalizou inicialmente o modelo de regressão de mínimos quadrados em previsões astronômicas. A maioria das contribuições à estatística antes de Fisher eram de físicos (ou matemáticos altamente aplicados cujo trabalho seria chamado de física pelos padrões de hoje): Lyapunov, De Moivre, Gauss e um ou mais Bernoullis.

O princípio geral é a caracterização de erros e a aparente aleatoriedade propagada a partir de um número infinito de fontes de variação não medidas. À medida que as experiências se tornaram mais difíceis de controlar, os erros experimentais precisavam ser formalmente descritos e contabilizados para calibrar a preponderância das evidências experimentais contra o modelo matemático proposto. Mais tarde, à medida que a física de partículas mergulhou na física quântica , a formalização de partículas como distribuições aleatórias deu uma linguagem muito mais concisa para descrever a aleatoriedade aparentemente incontrolável com fótons e elétrons.

As propriedades dos estimadores, como sua média (centro de massa) e desvio padrão (segundo momento dos desvios), são muito intuitivas para os físicos. A maioria dos teoremas de limites pode ser pouco ligada à lei de Murphy, ou seja, que a distribuição normal limitante é a entropia máxima.

Portanto, a estatística é uma sub-ramificação da física.

AdamO
fonte
5
Esta tese é tão implausível quanto ilógica. Como Stephen Stigler aponta em seus livros, psicólogos, economistas e a maioria dos outros cientistas sociais não adotaram os métodos dos físicos por mais um século devido a dúvidas reais sobre sua aplicabilidade e interpretação. Essa é uma evidência prima facie de que a estatística é muito mais do que um ramo da física. Outras disciplinas, desde a engenharia até a biologia, também empregam métodos físicos e teorias físicas, mas isso também não os torna ramos da física - pelo menos não de maneira significativa ou perspicaz.
whuber
O interesse dos Bernoulli pela probabilidade não surgiu do jogo, e não da física?
Dikran Marsupial
@whuber Assim como no meu campo, bioestatística, tenho plena consciência de que essas ciências aplicadas existiam de várias formas antes de sua identificação distinta como um campo da ciência. Acredito que esses campos foram formalmente precedidos pelo próprio campo da estatística. Claro que isso não é o caso da física. O único tema central nessas ciências aplicadas é a formulação de um processo como modelo, relacionando algum preditor a uma resposta. Talvez a linguagem da estatística tenha nascido em parte da necessidade de generalizar conceitos que se aplicam a esses campos.
Adamo
1
Você está pensando em Jacobus Bernoulli, autor póstumo de ars conjectandi (ed. Nicholaus Bernoulli, 1713). Provavelmente, as últimas pessoas que pareciam estar motivadas por problemas de jogo foram Pascal e Fermat em 1654, mas mesmo assim parece que eles estavam usando certos problemas de jogo (o "problema dos pontos") apenas como um exemplo motivacional e não como o foco de sua investigação. (Os estudos modernos na verdade traçam o problema dos pontos da lei islâmica dos contratos c. 1200.) O último matemático de nota que realmente foi motivado pelo jogo provavelmente foi Cardano (1501-1576).
whuber
1
Diaconis é o mágico ? Eu não confundiria jogar com carisma! Você tem razão, mas poderia recuar um pouco melhor sugerindo que muitos "investidores" são na verdade jogadores, de onde muitos teóricos em finanças matemáticas podem realmente ser motivados por essa forma de jogo. Apenas um pensamento ... De qualquer forma, está claro que, quando Huygens publicou seu pequeno tratado em 1657, as pessoas estavam criando uma teoria da probabilidade (e estatística) por razões muito mais profundas e abrangentes do que se saindo melhor nas mesas de jogo .
whuber