O futuro das estatísticas

11

Essa pergunta me ocorreu quando participei de uma palestra pública sobre questões não resolvidas em matemática. É sabido que ainda existem muitas questões matemáticas por resolver. Isso me fez pensar em quais são os problemas não resolvidos nas estatísticas. Depois de passar algum tempo pesquisando esse tópico no google, não acho que exista uma discussão relativamente detalhada sobre essa questão. Por isso, eu realmente gostaria de ouvir o que as pessoas pensam sobre isso. Para onde a estatística está indo como disciplina? Deveríamos gastar mais tempo aprimorando a teoria ou devemos nos concentrar em como analisar dados específicos coletados de todos os tipos de experimentos científicos? Qualquer pensamento sobre isso é muito apreciado. Obrigado!

20826
fonte
2
Antes de podermos falar sobre problemas não resolvidos nas estatísticas, precisamos definir estatísticas. Dimitriy Masterov deu uma resposta envolvendo econometria e Aksakal, envolvendo ciência de dados. Em matemática, os problemas de Hilbert foram compilados em um momento em que poderia haver o que, 100? 200? os melhores matemáticos de todo o mundo, e a maioria deles concordaria que sim, cada um dos 23 problemas é importante para resolver e bonito em seu currículo. Hoje em dia, há muito mais estatísticos e eles estão ocupados demais para coordenar.
StasK

Respostas:

7

Na minha opinião, tendo percorrido as margens da estatística perto das ciências sociais , a estatística deveria falar mais e se relacionar melhor com outras disciplinas, e os estatísticos deveriam dedicar mais tempo a aprender como comunicar melhor (a) para que são úteis (b). ) o que suas descobertas significam em termos dessa disciplina; (c) por que essas outras disciplinas são melhores trabalhando em conjunto com estatísticos do que sem elas. Não sei se o futuro da estatística depende disso, mas houve muitas oportunidades de perdão em sua curta história, com outras disciplinas inventando seus próprios métodos estatísticos.quando as estatísticas apropriadas não puderam fornecer. Quase todas as outras disciplinas científicas / de pesquisa, da biologia à antropologia, da psiquiatria à engenharia estrutural, podem facilmente colocar uma lista de 5 a 10 a 20 perguntas abertas que gostaria que as estatísticas respondessem.

StasK
fonte
10

David Cox explicou tudo em sua entrevista .

O @ram apontou para Q14-15. Curiosamente, também achei suas respostas esclarecedoras. Eu era muito cético em relação ao hype do Big Data . Os físicos lidaram com enormes conjuntos de dados por décadas sem muito barulho e publicidade irritante, assim como os pesquisadores de genética. Agora, uma vez que o pessoal de marketing se envolve, é Justin Bieber, de estatísticas. No entanto, Cox tem razão em que nas ciências sociais nunca tivemos grandes conjuntos de dados disponíveis, com exceção de finanças quantitativas, talvez. De fato, muitas técnicas econométricas foram desenvolvidas especificamente para lidar com pequenas amostras. Portanto, é interessante o que sairá do impulso do Big Data, talvez alguns desenvolvimentos interessantes nas estatísticas. Eu acho que a ênfase estaria nas ciências sociais, onde não existem bons modelos de nada. Ter modelos ruins e poucos dados pode ser bem diferente de ter modelos ruins e muitos dados, talvez haja menos foco na compreensão dos fenômenos, favorecendo apenas obter previsões precisas através do grande volume de dados e estatísticas inteligentes.

Aksakal
fonte
Perguntas 14--17.
Ocram
3
"Agora que o pessoal do marketing se envolve, é Justin Bieber, de estatística". - Muito agradável.
Gregory_britten
Esse é um julgamento interessante sobre econometria. Eu achava que os economistas usavam principalmente a teoria assintótica em seus fundamentos, como o GMM . Os artigos empíricos mais econômicos sobre economia estão utilizando o que agora será chamado de big data, por exemplo, todos os registros de nascimento do estado da Califórnia .
StasK
A econometria é um campo bastante amplo, o GMM é uma ferramenta popular em economia, mas todo tipo de outras técnicas são usadas, como programação dinâmica e processos de decisão markov em microeconometria, MIDAS em transmissão instantânea etc. É muita coisa divertida.
Aksakal
3

Como pensar em inferência causal quando houver interferência no controle do tratamento ou efeitos gerais de equilíbrio.

Dimitriy V. Masterov
fonte