Eu sei que as pessoas gostam de fechar duplicatas por isso estou não pedir uma referência para iniciar as estatísticas de aprendizagem (como aqui ).
Tenho doutorado em matemática, mas nunca aprendi estatística. Qual é o caminho mais curto para o conhecimento equivalente a um nível superior de estatística em BS e como faço para medir quando o alcancei?
Se uma lista de livros for suficiente (supondo que eu faça os exercícios, digamos), isso é fantástico. Sim, espero que resolver problemas seja uma parte implícita da aprendizagem, mas quero acelerar o máximo possível de forma realista. Não estou procurando um tratamento insanamente rigoroso, a menos que seja parte do que os especialistas em estatística geralmente aprendem.
references
careers
John Robertson
fonte
fonte
Respostas:
(Muito) conto
Para encurtar a história, em certo sentido, as estatísticas são como qualquer outro campo técnico: não há caminho rápido .
Longa história
Os programas de bacharelado em estatística são relativamente raros nos EUA. Uma razão pela qual acredito que isso é verdade é que é muito difícil incluir tudo o que é necessário para aprender estatística em um currículo de graduação. Isso é particularmente verdadeiro em universidades que possuem requisitos significativos de educação geral.
Desenvolver as habilidades necessárias (matemáticas, computacionais e intuitivas) exige muito esforço e tempo. As estatísticas podem começar a ser entendidas em um nível "operacional" bastante decente, uma vez que o aluno domina o cálculo e uma quantidade decente de álgebra linear e matricial. No entanto, qualquer estatístico aplicado sabe que é muito fácil encontrar-se em território que não está de acordo com uma abordagem estatística de receitas ou com base em receitas ou bolachas. Para realmente entender o que está acontecendo abaixo da superfície, é necessário como pré - requisitomaturidade matemática e, no mundo de hoje, maturidade computacional que só são realmente atingíveis nos anos posteriores da graduação. Esta é uma das razões pelas quais o verdadeiro treinamento estatístico começa principalmente no nível do MS nos EUA (a Índia, com seu ISI dedicado, é uma história um pouco diferente. Um argumento semelhante pode ser feito para alguma educação baseada no Canadá. Não estou familiarizado o suficiente com Ensino de estatística de graduação na Europa ou na Rússia para ter uma opinião informada.)
Quase qualquer trabalho (interessante) exigiria uma educação de nível de MS e os trabalhos realmente interessantes (na minha opinião) exigiriam essencialmente uma educação de nível de doutorado.
Visto que você tem um doutorado em matemática, apesar de não sabermos em que área, aqui estão minhas sugestões para algo mais próximo de uma educação em nível de MS. Incluo algumas observações entre parênteses para explicar as escolhas.
Complementos
Aqui estão alguns outros livros, principalmente de natureza um pouco mais avançada, teórica e / ou auxiliar, que são úteis.
Textos mais avançados (nível de doutorado)
Lehmann e Casella, Teoria da Estimativa de Pontos . (Tratamento de estimativa de pontos no nível de doutorado. Parte do desafio deste livro é lê-lo e descobrir o que é um erro de digitação e o que não é. Quando você se vê reconhecendo-os rapidamente, saberá que entende. Há muita prática desse tipo, especialmente se você se aprofundar nos problemas.)
Lehmann e Romano, testando hipóteses estatísticas . (Tratamento em nível de doutorado de teste de hipóteses. Não há tantos erros de digitação quanto o TPE acima.)
A. van der Vaart, Estatística Assintótica . (Um belo livro sobre a teoria assintótica da estatística com boas dicas sobre áreas de aplicação. Embora não seja um livro aplicado. Minha única dúvida é que alguma notação bastante bizarra é usada e, às vezes, os detalhes são escovados sob o tapete.)
fonte
Não posso falar pelas escolas mais rigorosas, mas estou fazendo um bacharelado em Estatística Geral (a mais rigorosa da minha escola) na Universidade da Califórnia, Davis, e existe uma quantidade bastante pesada de confiança no rigor e na derivação. Um doutorado em matemática será útil, pois você terá uma sólida formação em análise real e álgebra linear - habilidades úteis em estatística. Meu programa de estatística tem cerca de 50% dos cursos para apoiar os fundamentos (álgebra linear, análise real, cálculo, probabilidade, estimativa), e os outros 50% são direcionados a tópicos especializados que se apóiam nos fundamentos (não paramétricos, computação, ANOVA / Regressão, séries temporais, análise bayesiana).
Depois de obter os fundamentos, pular para os detalhes geralmente não é muito difícil. A maioria das pessoas nas minhas aulas luta com as provas e a análise real e apreende facilmente os conceitos estatísticos; portanto, a experiência em matemática definitivamente ajudará. Dito isto, os dois textos a seguir têm uma cobertura muito boa de muitos tópicos abordados em estatística. Ambos foram recomendados no link que você forneceu, a propósito, então eu não diria que sua pergunta e a que você vinculou são necessariamente não correlacionadas.
Métodos Matemáticos de Estatística , por Harald Cramer
Todas as estatísticas: um curso conciso em inferência estatística , de Larry Wasserman
fonte
A Royal Statistical Society no Reino Unido oferece o Diploma de Graduação em Estatística, que está no nível de um bom diploma de bacharel. Um currículo, lista de leitura e artigos anteriores estão disponíveis em seu site . Eu sei que matemáticos o usam para acelerar a estatística. Fazer os exames (oficialmente ou no conforto de seu próprio estudo) pode ser uma maneira útil de avaliar quando você está lá.
fonte
Eu acessava os sites de currículo das principais escolas de estatística, anotava os livros que eles usam em seus cursos de graduação, veria quais são altamente cotados na Amazon e os encomendaria na sua biblioteca pública / universidade.
Algumas escolas a considerar:
Complemente os textos com os vários sites de vídeos de palestras, como o MIT OCW e o videolectures.net.
A Caltech não possui graduação em estatística, mas você não errará ao seguir o currículo de seus cursos de estatística.
fonte
Vi a Inferência Estatística, de Silvey, usada por matemáticos que precisavam de alguma compreensão cotidiana das estatísticas. É um livro pequeno e, por direito, deve ser barato. Olhando para http://www.amazon.com/Statistical-Inference-Monographs-Statistics-Probability/dp/0412138204/ref=sr_1_1?ie=UTF8&s=books&qid=1298750064&sr=1-1 , parece ser barato em segunda mão.
É antigo e concentra-se nas estatísticas clássicas. Embora não seja altamente abstrato, ele é destinado a um público razoavelmente matemático - muitos dos exercícios são do Diploma de Cambridge (Reino Unido) em Estatística Matemática, que é basicamente um mestrado.
fonte
Com relação à medição de seu conhecimento: Você pode participar de algumas competições de mineração / análise de dados, como 1 , 2 , 3 , 4 , e ver como obtém uma pontuação em comparação com outras.
Existem muitas dicas para livros didáticos sobre estatística matemática nas respostas. Gostaria de adicionar como tópicos relevantes:
Disclaimer: Eu não sou um estatístico, estes são apenas meus 2 centavos
fonte
ET Jaynes "Teoria da Probabilidade: A Lógica da Ciência: Princípios e Aplicações Elementares Vol 1", Cambridge University Press, 2003 é praticamente uma leitura obrigatória para o lado bayesiano da estatística, no nível certo. Estou ansioso por recomendações para o lado freqüentista das coisas (tenho muitas monografias, mas muito poucos bons textos gerais).
fonte
Eu venho de uma formação em ciência da computação com foco em aprendizado de máquina. No entanto, comecei realmente a entender (e mais importante a aplicar) as estatísticas depois de fazer um curso de reconhecimento de padrões usando o Bishop's Book https://www.microsoft.com/en-us/research/people/cmbishop/#!prml-book
Aqui estão alguns slides do curso do MIT:
http://www.ai.mit.edu/courses/6.867-f03/lectures.html
Isso fornecerá apenas o plano de fundo (+ algum código do matlab) para usar estatísticas para problemas reais de trabalho e é definitivamente mais do lado aplicado.
No entanto, depende muito do que você deseja fazer com o seu conhecimento. Para obter uma medida de como você é bom, convém procurar no curso aberto de alguma universidade cursos de estatística avançada, para verificar se você conhece os tópicos abordados. Apenas meus 5 centavos.
fonte
Acho que Stanford oferece os melhores recursos quando se trata de flexibilidade. Eles ainda têm um curso de aprendizado de máquina on-line que forneceria uma base respeitável de conhecimento quando se trata de projetar algoritmos em R. Pesquise no Google e ele o redirecionará para a página de Lagunita, onde eles têm alguns cursos interessantes, a maioria deles eles sendo livres. Eu tenho os livros de Tibshirani, Introdução ao aprendizado estatístico 'e' Elementos do aprendizado estatístico 'em formatos PDF e ambos são recursos extremamente bons.
Como você é matemático, eu ainda aconselho você a não acelerar, pois isso não fornecerá uma base sólida que você pode achar muito útil no futuro, se começar a aprender a sério a máquina. Trate as estatísticas como um ramo da matemática para obter insights dos dados, e isso requer algum trabalho. Fora isso, existem muitos recursos online, Johns Hopkins fornece coisas semelhantes às de Stanford. Embora a experiência sempre pague, uma credencial respeitável sempre reforçará essa base. Você também pode pensar nos campos específicos que gostaria de inserir; com isso, quero dizer se você deseja entrar em análise de texto ou aplicar suas habilidades de matemática e estatísticas em finanças. Eu venho na última categoria, então eu tenho uma licenciatura em econometria, onde estudamos finanças + estatística. Uma combinação sempre pode ser muito boa.
fonte