Por que as estatísticas bayesianas estão se tornando um tópico de pesquisa cada vez mais popular? [fechadas]

10

Navegando pela área de pesquisa dos 100 principais programas estatísticos do US News, quase todos são pesados ​​nas estatísticas bayesianas. No entanto, se eu for para o ensino médio, a maioria deles ainda está pesquisando estatísticas clássicas / freqüentistas. Por exemplo, minha escola atual (classificada entre 150 e 200 no ranking mundial de QS para estatísticas, não considerada uma escola de nível superior) tem apenas um professor focado nas estatísticas bayesianas e há quase um ressentimento em relação às estatísticas bayesianas. Alguns estudantes de pós-graduação com quem conversei dizem até que os estatísticos bayesianos estão fazendo estatísticas bayesianas por causa disso, é claro que eu discordo totalmente.

No entanto, eu me pergunto por que esse é o caso. Estou tendo vários palpites:

(a) não há espaço suficiente para avanços na metodologia das estatísticas clássicas / freqüentes e a única pesquisa viável na pesquisa de estatísticas clássicas / freqüentadoras é em aplicativos que serão o foco principal da escola de nível inferior, pois a escola de nível superior deve ser mais inclinado à pesquisa teórica e metodológica.

(b) Depende muito do campo. Certos ramos de estatísticas são simplesmente mais adequados para estatísticas bayesianas, como muitas aplicações científicas do método de estatísticas, enquanto outros ramos são mais adequados para estatísticas clássicas, como área financeira. (corrija-me se eu estiver errado) Dado isso, parece-me que as escolas de nível superior têm muitas faculdades de estatística fazendo aplicações no campo científico, enquanto o departamento de estatísticas de escolas de nível inferior está focando principalmente os aplicativos na área financeira, pois isso os ajuda a gerar renda e financiamento.

(c) Existem enormes problemas com o método frequentista que não podem ser resolvidos, por exemplo, a tendência a sobreajuste do MLE, etc. E o Bayesiano parece fornecer soluções brilhantes.

(d) O poder computacional está aqui, portanto, a computação bayesiana não é mais um gargalo, como era há 30 anos.

(e) Esse pode ser o palpite mais opinativo que tenho. Existe uma resistência do estatístico clássico / freqüentista que simplesmente não gosta de uma nova onda de metodologia que pode potencialmente ultrapassar o papel das estatísticas clássicas. Mas, como disse Larry Wasserman, depende do que estamos tentando fazer e todos devem manter a mente aberta, especialmente como pesquisador.

davidolohowski
fonte
11
Embora as opiniões dos habitantes de CV variem e essa opinião seja considerada fora de tópico, vale ressaltar que exatamente essa pergunta é respondida nos capítulos introdutórios dos textos modernos sobre a análise bayesiana. Em particular, o Capítulo 1 de Gelman et ai. Bayesian Data Analysis 3rd Ed. Tudo se resume a: a) "senso comum" eb) o intervalo de confiança freqüentista altamente problemático que 99% de nós não pode deixar de interpretar mal. A maneira como interpretamos mal é intrinsecamente bayesiana; portanto, podemos fazer análises bayesianas desde o início.
Peter Leopold
3
@ Peter Leopold Metade a sério: 99%? e quem é "nós"? Muitos usuários ingênuos de estatísticas realmente têm sérios equívocos sobre ICs, mas se você estiver se dirigindo à comunidade de CV, espero que 99% realmente não se encaixem. As pessoas estatísticas podem ser tão ruins quanto qualquer outra pessoa em inventar números na ausência de dados concretos!
Nick Cox
@NickCox, eu estava abordando o OP, e o "nós" deve ser compreensivo e inclusivo. Felizmente, "99%" é reconhecido como uma ordem de magnitude estimada . É também a maior fração do tropo ter / não ter na cultura popular, onde os que não têm nesse contexto indicam o evento: "Peguei estatísticas 101, mas ainda não internalizei completamente a interpretação frequentista versus bayesiana dos intervalos de confiança. vs. intervalos credíveis ". E agora que você me chamou, eu afirmo (: D) que é o meu oficial antes desse evento! Naturalmente, estou disposto a me convencer do contrário! : D102
Peter Leopold

Respostas:

8

Pessoalmente, eu arriscaria alguns palpites:

(1) As estatísticas bayesianas registraram um enorme aumento na popularidade nas últimas duas décadas. Parte disso ocorreu devido a avanços no MCMC e a melhorias nos recursos computacionais. As estatísticas bayesianas deixaram de ser teoricamente realmente boas, mas aplicáveis ​​apenas a problemas com brinquedos, para uma abordagem que poderia ser aplicada de maneira mais universal. Isso significa que, há vários anos, dizer que você trabalhava com estatísticas bayesianas provavelmente o tornava um funcionário muito competitivo.

Agora, eu diria que as estatísticas bayesianas ainda são um plus, mas o mesmo está trabalhando em problemas interessantes sem usar métodos bayesianos. A falta de formação em estatística bayesiana certamente seria um sinal negativo para a maioria dos comitês de contratação, mas obter um doutorado em estatística sem treinamento suficiente em métodos bayesianos seria bastante surpreendente.

(2) Os estatísticos bayesianos mencionarão "bayesiano" em seu currículo. Os freqüentistas geralmente não colocam "Frequentista" em seu currículo, mas muito mais tipicamente na área em que trabalham (por exemplo, análise de sobrevivência, modelagem preditiva, previsão etc.). Como exemplo, muito do meu trabalho é escrever algoritmos de otimização, o que eu acho que implica que você diria que significa que eu trabalho com frequência. Também escrevi uma boa parte dos algoritmos bayesianos, mas certamente está na minoria do meu trabalho. As estatísticas bayesianas estão no meu currículo, as estatísticas freqüentistas não.

(3) Até certo ponto, o que você disse em sua pergunta também mantém a verdade. A computação bayesiana geral eficiente possui mais problemas em aberto do que o reino freqüentista. Por exemplo, o Hamiltoniano Monte Carlo tornou-se recentemente um algoritmo muito empolgante para amostragem genericamente de modelos bayesianos. Não há muito espaço para aprimoramento de genéricosotimização nos dias de hoje; Os algoritmos de Newton Raphson, L-BFGS e EM cobrem muitas bases. Se você deseja aprimorar esses métodos, geralmente precisa se especializar muito no problema. Como tal, você prefere dizer "Trabalho na otimização de alta dimensão de modelos geoespaciais" em vez de "Trabalho na estimativa de máxima verossimilhança de alta dimensão". O mundo do aprendizado de máquina é uma exceção, pois há muita empolgação em descobrir novos métodos de otimização estocástica (por exemplo, SGD, Adam etc.), mas essa é uma fera um pouco diferente por alguns motivos.

Da mesma forma, há trabalho a ser feito para criar bons priores para os modelos. Métodos frequentistas fazer tem um equivalente a este (chegando com boas penalidades, ou seja, laço, glmnet), mas não há terra provavelmente mais fértil para priores mais de penalidades.

(4) Finalmente, e essa é definitivamente uma opinião pessoal, muitas pessoas associam o Frequentist aos valores-p. Dado o uso indevido geral de valores-p observado em outros campos, muitos estatísticos adorariam se distanciar o máximo possível dos atuais usos indevidos de valores-p.

Cliff AB
fonte
3
Portanto, a resposta para o porquê de se tornar mais popular inclui (1) que se tornou mais popular. Intrigado com isso, mas imagino que seja apenas uma questão de precisar reformular.
Nick Cox
@NickCox: meu argumento é que é mais popular, mas também sua popularidade pode ser exagerada. Ou seja, o OP viu que a estatística Bayesiana estava no currículo de quase todos os professores de uma amostra das principais universidades. Mas isso não significa que cada um desses professores faça apenas estatísticas bayesianas. Outro ponto em (1) foi que eu acho que foi um tempo ao fazer estatística Bayesiana como sua área de pesquisa foi muito importante para a obtenção de uma posição de nível superior. Não tenho mais certeza de que seja um requisito tão rigoroso, mas muitos dos professores que você vê agora foram contratados durante esse período.
Cliff AB
Oh, entendo o seu ponto. Eu estava focando na discussão do "É porque não há espaço suficiente para avançar nas estatísticas clássicas / freqüentistas?" e não tanto no "por que isso está acontecendo?"
Cliff AB