Em matemática, existem ramos como álgebra, análise, topologia, etc. No aprendizado de máquina, há aprendizado supervisionado, não supervisionado e de reforço. Dentro de cada uma dessas ramificações, existem ramificações mais refinadas que dividem ainda mais os métodos.
Estou tendo problemas para traçar um paralelo com as estatísticas. Quais seriam os principais ramos da estatística (e sub-ramos)? Uma partição perfeita provavelmente não é possível, mas qualquer coisa é melhor do que um grande mapa em branco.
self-study
classification
silly.deer
fonte
fonte
Respostas:
Acho esses sistemas de classificação extremamente inúteis e contraditórios. Por exemplo:
e assim por diante. Não existem "ramificações" inequívocas da matemática, e nem deveria haver estatísticas.
fonte
Este é um contraponto menor à resposta de Rob Hyndman. Começou como um comentário e depois ficou complexo demais para um. Se isso estiver muito longe de abordar a questão principal, peço desculpas e a excluirei.
A biologia descreve relações hierárquicas desde muito antes do primeiro doodle de Darwin (veja o comentário de Nick Cox para obter um link). A maioria das relações evolutivas ainda é mostrada com esse tipo de 'árvore filogenética' agradável, limpa e ramificada:
No entanto, acabamos percebendo que a biologia é mais confusa do que isso. Ocasionalmente, há trocas genéticas (através de cruzamentos e outros processos) entre espécies e genes distintos presentes em uma parte do 'salto' da árvore para uma parte diferente da árvore. A transferência horizontal de genes move os genes de uma maneira que torna imprecisa a simples representação das árvores. No entanto, não abandonamos as árvores, apenas criamos modificações para este tipo de visualização:
É mais difícil de seguir, mas transmite uma imagem mais precisa da realidade.
Outro exemplo:
No entanto, nunca apresentamos essas figuras mais complexas para começar, porque são difíceis de entender sem entender os conceitos básicos. Em vez disso, ensinamos a idéia básica com a figura simples e, em seguida, apresentamos a figura mais complexa e as complicações mais recentes da história.
Qualquer "mapa" estatístico seria igualmente impreciso e uma ferramenta de ensino valiosa. As visualizações da forma que o OP sugere são muito úteis para os alunos e não devem ser ignoradas apenas porque não conseguem capturar a realidade no total. Podemos adicionar mais complexidade à imagem uma vez que eles tenham uma estrutura básica em vigor.
fonte
Você pode procurar nas palavras-chave / tags do site Cross Validated.
Ramos como uma rede
Uma maneira de fazer isso é plotá-lo como uma rede com base nos relacionamentos entre as palavras-chave (com que frequência coincidem no mesmo post).
Quando você usa esse script sql para obter os dados do site em (data.stackexchange.com/stats/query/edit/1122036)
Em seguida, você obtém uma lista de palavras-chave para todas as perguntas com pontuação 2 ou superior.
Você pode explorar essa lista plotando algo como o seguinte:
Atualização: o mesmo com cor (com base nos vetores próprios da matriz de relação) e sem a etiqueta de auto-estudo
Você poderia limpar esse gráfico um pouco mais (por exemplo, retire as tags que não se relacionam a conceitos estatísticos, como tags de software, no gráfico acima isso já foi feito para a tag 'r') e melhore a representação visual, mas acho que esta imagem acima já mostra um bom ponto de partida.
Código R:
Ramos hierárquicos
Acredito que esse tipo de gráfico de rede acima esteja relacionado a algumas das críticas a uma estrutura hierárquica puramente ramificada. Se você preferir, acho que você pode executar um cluster hierárquico para forçá-lo a uma estrutura hierárquica.
Abaixo está um exemplo desse modelo hierárquico. Ainda seria necessário encontrar nomes de grupos adequados para os vários clusters (mas, não acho que esse cluster hierárquico seja a boa direção, deixo em aberto).
A medida da distância para o agrupamento foi encontrada por tentativa e erro (fazendo ajustes até os clusters parecerem bons.
Escrito por StackExchangeStrike
fonte
Uma maneira fácil de responder sua pergunta é procurar as tabelas de classificação comuns. Por exemplo, 2010 Mathematics Subject Classification é usado por algumas publicações para classificar artigos. Isso é relevante porque é assim que muitos autores classificam seus próprios artigos.
Existem muitos exemplos de classificações semelhantes, por exemplo, a classificação do arxiv ou o UDK (classificação decimal universal) do Ministério da Educação da Rússia, que é amplamente utilizado em todas as publicações e pesquisas.
Outro exemplo é o JEL Claasification System da American Economic Association. Artigo de Rob Hyndman " Previsão automática de séries temporais: o pacote de previsão para R. " É classificado como C53, C22, C52 de acordo com JEL. Hyndman tem razão em criticar as classificações das árvores. Uma abordagem melhor poderia ser a marcação, por exemplo, as palavras-chave em seu artigo são: "modelos ARIMA, previsão automática, suavização exponencial, intervalos de previsão, modelos de espaço de estados, séries temporais, R." Pode-se argumentar que essas são as melhores maneiras de classificar os trabalhos, pois não são hierárquicas e podem ser criadas várias hierarquias.
O @whuber enfatizou que alguns avanços mais recentes, como o aprendizado de máquina, não estarão nas estatísticas das classificações atuais. Por exemplo, dê uma olhada no artigo " Aprendizagem Profunda: Uma Introdução para Matemáticos Aplicados ", de Catherine F. Higham, Desmond J. Higham. Eles classificaram seu trabalho no MSC acima mencionado como 97R40, 68T01, 65K10, 62M45. estes estão sob ciência da computação, ensino de matemática e análise numérica, além de estatísticas
fonte
Uma maneira de abordar o problema é examinar as redes de citação e coautoria em periódicos de estatística, como os Annals of Statistics, Biometrika, JASA e JRSS-B. Isso foi feito por:
Eles identificaram comunidades de estatísticos e usaram seu domínio para rotular as comunidades como:
O artigo inclui uma discussão detalhada das comunidades, juntamente com decomposições das maiores em subcomunidades adicionais.
Isso pode não responder inteiramente à pergunta, já que se refere aos campos de pesquisa de estatísticos, e não a todos os campos, incluindo aqueles que não estão mais ativos. Espero que seja útil. Obviamente, existem outras advertências (como considerar apenas essas quatro revistas) que são discutidas mais adiante neste artigo.
fonte
Vejo muitas respostas surpreendentes e não sei como pode ser recebida uma humilde classificação pessoal, mas não conheço nenhum livro abrangente de todas as estatísticas para mostrar o resumo, e acho que, como @ Como comentou brilhantemente, uma classificação de um campo de estudo pode ser útil. Então, aqui está minha chance:
É claro que isso é simplista demais, serve apenas para levar uma idéia direta a alguém que mal conhece o campo. Cada um de nós aqui certamente sabe que existem muitos métodos entre as categorias aqui em cima, muitos outros que eu não conheci. lista porque são menos famosos ou porque simplesmente esqueci. Espero que você goste.
fonte
Uma maneira de organizar essas informações é encontrar um bom livro e consultar o índice. Isso é um paradoxo, porque você perguntou especificamente sobre estatística , enquanto a maioria dos textos introdutórios de pós-graduação sobre o tema é para estatística e teoria das probabilidades . Um livro que estou lendo sobre regressão agora tem o seguinte sumário:
Modelos de Dados Binários
Modelos de regressão geral
(As seções restantes estão apoiando a matemática e a teoria das probabilidades)
fonte