A matemática tem seus famosos problemas do milênio (e, historicamente, os 23 de Hilbert ), questões que ajudaram a moldar a direção do campo.
Tenho pouca ideia, no entanto, quais seriam as hipóteses de Riemann e P vs. NP de estatística.
Então, quais são as questões abertas abrangentes nas estatísticas?
Editado para adicionar: Como um exemplo do espírito geral (se não bastante específico) da resposta que estou procurando, encontrei uma palestra inspirada em "Hilbert's 23", de David Donoho, em uma conferência "Desafios matemáticos do século XXI": Análise de dados em alta dimensão: as maldições e bênçãos da dimensionalidade
Portanto, uma resposta em potencial poderia falar sobre big data e por que é importante, os tipos de desafios estatísticos que os dados de alta dimensão apresentam e os métodos que precisam ser desenvolvidos ou as perguntas que precisam ser respondidas para ajudar a resolver o problema.
Respostas:
Uma grande questão deve envolver questões-chave da metodologia estatística ou, como a estatística é inteiramente sobre aplicativos, deve se preocupar como a estatística é usada com problemas importantes para a sociedade.
Essa caracterização sugere que o seguinte deve ser incluído em qualquer consideração de grandes problemas:
Qual a melhor forma de realizar ensaios com drogas . Atualmente, o teste clássico de hipóteses requer muitas fases formais de estudo. Nas fases posteriores (confirmatórias), as questões econômicas e éticas se aproximam. Podemos fazer melhor? Temos que colocar centenas ou milhares de pessoas doentes em grupos de controle e mantê-las lá até o final de um estudo, por exemplo, ou podemos encontrar melhores maneiras de identificar tratamentos que realmente funcionam e entregá-los aos membros do estudo (e outros) mais cedo?
Lidar com o viés de publicação científica . Os resultados negativos são publicados muito menos simplesmente porque eles simplesmente não atingem um valor p mágico. Todos os ramos da ciência precisam encontrar melhores maneiras de trazer à luz resultados cientificamente importantes, e não apenas estatisticamente significativos . (O problema de múltiplas comparações e o enfrentamento de dados de alta dimensão são subcategorias desse problema.)
Sondar os limites dos métodos estatísticos e suas interfaces com o aprendizado de máquina e a cognição de máquina . Inevitáveis avanços na tecnologia da computação tornarão a IA verdadeira acessível em nossas vidas. Como vamos programar cérebros artificiais? Qual o papel do pensamento estatístico e do aprendizado estatístico na criação desses avanços? Como os estatísticos podem ajudar a pensar sobre cognição artificial, aprendizado artificial, explorar suas limitações e avançar?
Desenvolvendo melhores maneiras de analisar dados geoespaciais . Alega-se frequentemente que a maioria, ou grande maioria, dos bancos de dados contém referências de localização. Em breve, muitas pessoas e dispositivos serão localizados em tempo real com tecnologias de GPS e telefone celular. Os métodos estatísticos para analisar e explorar dados espaciais estão realmente na sua infância (e parecem relegados ao GIS e ao software espacial, que normalmente é usado por não estatísticos).
fonte
Michael Jordan tem um pequeno artigo chamado Quais são os problemas em aberto nas estatísticas bayesianas? , em que ele pesquisou um monte de estatísticos por suas opiniões sobre os problemas em aberto nas estatísticas. Resumirei (ou seja, copie e cole) um pouco aqui, mas provavelmente é melhor apenas ler o original.
Não paramétricos e semiparamétricos
Priores
Relações bayesianas / freqüentistas
Computação e estatística
Seleção de Modelo e Teste de Hipóteses
fonte
Não tenho certeza do tamanho deles, mas há uma página da Wikipedia para problemas não resolvidos nas estatísticas. Sua lista inclui:
fonte
Como exemplo do espírito geral (se não bastante específico) da resposta que estou procurando, encontrei uma palestra inspirada em "Hilbert's 23", de David Donoho, em uma conferência "Desafios matemáticos do século XXI":
Análise de dados em alta dimensão: as maldições e bênçãos da dimensionalidade
fonte
O Mathoverflow tem uma pergunta semelhante sobre grandes problemas na teoria das probabilidades .
Parece que nessa página as perguntas mais importantes têm a ver com evitar auto-passeios e percolações aleatórias.
fonte
Você pode conferir o colóquio "Hard Problems in the Social Sciences" de Harvard, realizado no início deste ano. Várias dessas palestras oferecem questões sobre o uso da estatística e modelagem nas ciências sociais.
fonte
Minha resposta seria a luta entre estatísticas freqüentistas e bayesianas. Quando as pessoas perguntam em que você "acredita", isso não é bom! Especialmente para uma disciplina científica.
fonte