Há uma sobreposição considerável entre eles, mas algumas distinções podem ser feitas. Por necessidade, terei que simplificar demais algumas coisas ou dar pouca atenção a outras, mas farei o possível para dar uma idéia dessas áreas.
Em primeiro lugar, a inteligência artificial é bastante distinta do resto. AI é o estudo de como criar agentes inteligentes. Na prática, é como programar um computador para se comportar e executar uma tarefa como um agente inteligente (digamos, uma pessoa). Isso não precisa envolver aprendizado ou indução, pode ser apenas uma maneira de "construir uma ratoeira melhor". Por exemplo, os aplicativos de IA incluem programas para monitorar e controlar processos em andamento (por exemplo, aumente o aspecto A se parecer muito baixo). Observe que a IA pode incluir tudo o que uma máquina faz, desde que não o faça 'estupidamente'.
Na prática, no entanto, a maioria das tarefas que requerem inteligência exige a capacidade de induzir novos conhecimentos a partir de experiências. Assim, uma grande área dentro da IA é o aprendizado de máquina . Diz-se que um programa de computador aprende alguma tarefa com a experiência se seu desempenho na tarefa melhorar com a experiência, de acordo com alguma medida de desempenho. O aprendizado de máquina envolve o estudo de algoritmos que podem extrair informações automaticamente (ou seja, sem orientação humana on-line). Certamente, alguns desses procedimentos incluem idéias derivadas diretamente de, ou inspiradas por, estatísticas clássicas, mas elas não têmser estar. Da mesma forma que a IA, o aprendizado de máquina é muito amplo e pode incluir quase tudo, desde que haja algum componente indutivo. Um exemplo de algoritmo de aprendizado de máquina pode ser um filtro Kalman.
A mineração de dados é uma área que tirou grande parte de sua inspiração e técnicas do aprendizado de máquina (e algumas também da estatística), mas foi colocada em diferentes fins . A mineração de dados é realizada por uma pessoa , em uma situação específica, em um conjunto de dados específico, com um objetivo em mente. Normalmente, essa pessoa deseja aproveitar o poder das várias técnicas de reconhecimento de padrões desenvolvidas no aprendizado de máquina. Muitas vezes, o conjunto de dados é maciço , complicado e / ou pode ter problemas especiais(como existem mais variáveis que observações). Normalmente, o objetivo é descobrir / gerar algumas idéias preliminares em uma área onde realmente havia pouco conhecimento de antemão, ou ser capaz de prever com precisão observações futuras. Além disso, os procedimentos de mineração de dados podem ser 'não supervisionados' (não sabemos a resposta - descoberta) ou 'supervisionados' (sabemos a resposta - previsão). Observe que o objetivo geralmente não é desenvolver um entendimento mais sofisticado do processo de geração de dados subjacente. Técnicas comuns de mineração de dados incluem análises de cluster, árvores de classificação e regressão e redes neurais.
Suponho que não preciso dizer muito para explicar o que são estatísticas neste site, mas talvez eu possa dizer algumas coisas. A estatística clássica (aqui, quero dizer, tanto freqüentista quanto bayesiana) é um subtópico da matemática. Penso nisso como a interseção entre o que sabemos sobre probabilidade e o que sabemos sobre otimização. Embora a estatística matemática possa ser estudada como simplesmente um objeto platônico de investigação, ela é entendida como mais prática e aplicada em caráter do que outras áreas mais rarefeitas da matemática. Como tal (e notadamente em contraste com a mineração de dados acima), ele é empregado principalmente para entender melhor alguns processos específicos de geração de dados. Assim, geralmente começa com um modelo formalmente especificado, e daí derivam procedimentos para extrair com precisão esse modelo de instâncias ruidosas (ou seja, estimativa - otimizando alguma função de perda) e ser capaz de diferenciá-lo de outras possibilidades (ou seja, inferências baseadas em propriedades conhecidas de distribuições de amostragem). A técnica estatística prototípica é a regressão.
Common data mining techniques would include cluster analyses, classification and regression trees, and neural networks.
É seguro dizer que uma rede neural é um exemplo de uma ferramenta de aprendizado de máquina usada na mineração de dados, em comparação com uma análise de cluster que é um algoritmo não projetado para o aprendizado de máquina usado na mineração de dados?Muitas das outras respostas abordaram os pontos principais, mas você solicitou uma hierarquia, se houver alguma, e a maneira como a vejo, embora sejam disciplinas por si só, existe uma hierarquia que ninguém parece ter mencionado ainda, pois cada uma delas se baseia em o anterior.
Em resumo
Agora, sendo dito isso, haverá alguns problemas de IA que se enquadram apenas na IA e da mesma forma para os outros campos, mas a maioria dos problemas interessantes hoje (carros autônomos, por exemplo) poderia ser fácil e corretamente chamada de todos esses. Espero que isso esclareça o relacionamento entre eles sobre o qual você perguntou.
fonte
Em geral, os modelos probabilísticos (e, portanto, as estatísticas) provaram ser a maneira mais eficaz de estruturar formalmente o conhecimento e o entendimento em uma máquina, a tal ponto que todos os outros três (AI, ML e DM) são hoje principalmente subcampos de Estatisticas. Não é a primeira disciplina a se tornar um braço sombrio da estatística ... (Economia, psicologia, bioinformática, etc.)
fonte
Podemos dizer que eles são todos relacionados, mas são coisas diferentes. Embora você possa ter coisas em comum entre eles, como em estatísticas e mineração de dados, você usa métodos de cluster.
Deixe-me tentar definir brevemente cada um:
A estatística é uma disciplina muito antiga, principalmente baseada em métodos matemáticos clássicos, que podem ser usados para o mesmo objetivo que a mineração de dados às vezes é classificar e agrupar coisas.
A mineração de dados consiste em construir modelos para detectar os padrões que nos permitem classificar ou prever situações, dada uma quantidade de fatos ou fatores.
Inteligência artificial (veja Marvin Minsky *) é a disciplina que tenta imitar como o cérebro trabalha com métodos de programação, por exemplo, a construção de um programa que joga xadrez.
O aprendizado de máquina é a tarefa de construir conhecimento e armazená-lo de alguma forma no computador; esse formulário pode ser de modelos matemáticos, algoritmos, etc. Qualquer coisa que possa ajudar a detectar padrões.
fonte
Eu estou mais familiarizado com o aprendizado de máquina - eixo de mineração de dados -, então vou me concentrar nisso:
O aprendizado de máquina tende a se interessar por inferência em situações não padronizadas, por exemplo, dados não-iid, aprendizado ativo, aprendizado semi-supervisionado, aprendizado com dados estruturados (por exemplo, strings ou gráficos). O ML também tende a se interessar por limites teóricos sobre o que é aprendível, o que geralmente forma a base dos algoritmos utilizados (por exemplo, a máquina de vetores de suporte). ML tende a ser de natureza bayesiana.
A mineração de dados está interessada em encontrar padrões nos dados que você ainda não conhece. Não sei se isso é significativamente diferente da análise exploratória de dados nas estatísticas, enquanto no aprendizado de máquina geralmente há um problema mais bem definido a ser resolvido.
O ML tende a se interessar mais por pequenos conjuntos de dados em que o ajuste excessivo é o problema e a mineração de dados tende a se interessar por conjuntos de dados em larga escala nos quais o problema está lidando com as quantidades de dados.
Estatísticas e aprendizado de máquina fornecem muitas das ferramentas básicas usadas pelos mineradores de dados.
fonte
Aqui está a minha opinião. Vamos começar com as duas categorias muito amplas:
Tanto o ML quanto o DM são geralmente IA e estatística, pois geralmente envolvem métodos básicos de ambos. Aqui estão algumas das diferenças:
Além disso, a mineração de dados geralmente envolve muito mais gerenciamento de dados , como organizar os dados em estruturas e bancos de dados de índices eficientes.
Infelizmente, eles não são tão fáceis de separar. Por exemplo, há "aprendizado não supervisionado", que geralmente está mais relacionado ao DM do que ao ML, pois não pode otimizar em direção à meta. Por outro lado, os métodos de DM são difíceis de avaliar (como você avalia algo que você não conhece?) E geralmente são avaliados nas mesmas tarefas que o aprendizado de máquina, deixando de fora algumas informações. Isso, no entanto, geralmente fará com que pareçam funcionar pior do que os métodos de aprendizado de máquina que podem otimizar em direção ao objetivo de avaliação real.
Além disso, eles são frequentemente usados em combinações. Por exemplo, um método de mineração de dados (digamos, agrupamento ou detecção externa não supervisionada) é usado para pré-processar os dados e, em seguida, o método de aprendizado de máquina é aplicado nos dados pré-processados para treinar melhores classificadores.
O aprendizado de máquina geralmente é muito mais fácil de avaliar: há um objetivo, como pontuação ou previsão de classe. Você pode calcular precisão e recall. Na mineração de dados, a maioria das avaliações é feita deixando de fora algumas informações (como rótulos de classe) e testando se seu método descobriu a mesma estrutura. Isso é ingênuo no sentido, pois você supõe que os rótulos da classe codificam a estrutura dos dados completamente; você realmente pune o algoritmo de mineração de dados que descobre algo novo em seus dados. Outra maneira de - indiretamente - avaliar, é como a estrutura descoberta melhora o desempenho do algoritmo real de ML (por exemplo, ao particionar dados ou remover outliers). Ainda assim, essa avaliação é baseada na reprodução dos resultados existentes, o que não é realmente o objetivo da mineração de dados ...
fonte
Eu acrescentaria algumas observações ao que foi dito ...
AI é um termo muito amplo para qualquer coisa que tenha a ver com máquinas que executam atividades semelhantes ao raciocínio ou que parecem sencientes, desde o planejamento de uma tarefa ou a cooperação com outras entidades, até o aprendizado de operar membros para andar. Uma definição concisa é que a IA é algo relacionado ao computador que ainda não sabemos como fazer bem. (Depois que sabemos como fazê-lo bem, geralmente ele recebe seu próprio nome e não é mais "AI").
Tenho a impressão, ao contrário da Wikipedia, de que o Reconhecimento de Padrões e o Aprendizado de Máquina são o mesmo campo, mas o primeiro é praticado por cientistas da computação, enquanto o segundo é praticado por estatísticos e engenheiros. (Muitos campos técnicos são descobertos repetidamente por diferentes subgrupos, que geralmente trazem sua própria linguagem e mentalidade para a mesa.)
A mineração de dados, em minha opinião, de qualquer maneira, pega o Machine Learning / reconhecimento de padrões (as técnicas que funcionam com os dados) e os envolve em banco de dados, infraestrutura e técnicas de validação / limpeza de dados.
fonte
Infelizmente, a diferença entre essas áreas é em grande parte onde elas são ensinadas: a estatística é baseada em depósitos de matemática, ai, aprendizado de máquina em depósitos de ciência da computação e a mineração de dados é mais aplicada (usada por depósitos de negócios ou marketing, desenvolvida por empresas de software) .
Em primeiro lugar, a IA (embora possa significar qualquer sistema inteligente) tradicionalmente significa abordagens baseadas em lógica (por exemplo, sistemas especialistas), em vez de estimativa estatística. A estatística, baseada em representações matemáticas, teve um entendimento teórico muito bom, juntamente com uma forte experiência aplicada em ciências experimentais, onde existe um modelo científico claro, e é necessária estatística para lidar com os limitados dados experimentais disponíveis. Muitas vezes, o foco está em extrair o máximo de informações de conjuntos de dados muito pequenos. além disso, existe uma tendência para as provas matemáticas: você não será publicado a menos que possa provar coisas sobre sua abordagem. Isso costuma significar que as estatísticas estão atrasadas no uso de computadores para automatizar a análise. Novamente, a falta de conhecimento de programação impediu que os estatísticos trabalhassem em problemas de larga escala, onde os problemas computacionais se tornavam importantes (considere GPUs e sistemas distribuídos, como o hadoop). Acredito que áreas como bioinformática agora mudaram mais as estatísticas nessa direção. Finalmente, eu diria que os estatísticos são um grupo mais cético: eles não afirmam que você descobre conhecimento com estatística - em vez disso, um cientista apresenta uma hipótese, e o trabalho do estatístico é verificar se a hipótese é suportada pelos dados. O aprendizado de máquina é ensinado nos departamentos cs, que infelizmente não ensinam a matemática apropriada: cálculo multivariável, probabilidade, estatística e otimização não são comuns ... temos conceitos vagos e "glamourosos", como aprender com exemplos ...Elementos de aprendizagem estatística página 30. Isso tende a significar que há muito pouco entendimento teórico e uma explosão de algoritmos, pois os pesquisadores sempre podem encontrar alguns conjuntos de dados nos quais seu algoritmo se mostra melhor. Portanto, existem enormes fases de hype à medida que os pesquisadores de ML buscam a próxima grande novidade: redes neurais, aprendizado profundo etc. Infelizmente, há muito mais dinheiro nos departamentos de CS (pense no Google, Microsoft, juntamente com o 'aprendizado' mais comercializável). estatísticos mais céticos são ignorados. Finalmente, há uma tendência empirista: basicamente, existe uma crença subjacente de que, se você lançar dados suficientes no algoritmo, ele 'aprenderá' as previsões corretas. Embora eu seja tendencioso contra o ML, há um insight fundamental no ML que os estatísticos ignoraram: que os computadores podem revolucionar a aplicação das estatísticas.
Existem duas maneiras: a) automatizar a aplicação de testes e modelos padrão. Por exemplo, executando uma bateria de modelos (regressão linear, florestas aleatórias, etc, tentando diferentes combinações de entradas, configurações de parâmetros, etc.). Isso realmente não aconteceu - embora eu suspeite que os concorrentes do kaggle desenvolvam suas próprias técnicas de automação. b) aplicação de modelos estatísticos padrão a dados enormes: pense, por exemplo, no google tradutor, em sistemas de recomendação etc. (ninguém está afirmando que, por exemplo, as pessoas traduzem ou recomendam dessa forma ... mas é uma ferramenta útil). Os modelos estatísticos subjacentes são diretos, mas existem enormes problemas computacionais na aplicação desses métodos a bilhões de pontos de dados.
A mineração de dados é o culminar dessa filosofia ... desenvolvendo maneiras automatizadas de extrair conhecimento dos dados. No entanto, possui uma abordagem mais prática: essencialmente é aplicada a dados comportamentais, onde não existe uma teoria científica abrangente (marketing, detecção de fraudes, spam, etc.) e o objetivo é automatizar a análise de grandes volumes de dados: sem dúvida, uma Uma equipe de estatísticos poderia produzir análises melhores com tempo suficiente, mas é mais econômico usar um computador. Além disso, como D. Hand explica, é a análise de dados secundários - dados que são registrados de qualquer maneira e não dados coletados explicitamente para responder a uma pergunta científica em um sólido projeto experimental. Estatísticas de mineração de dados e muito mais, D Hand
Então, eu resumiria que a IA tradicional é baseada na lógica e não estatística, o aprendizado de máquina é estatística sem teoria e estatística é 'estatística sem computadores' e a mineração de dados é o desenvolvimento de ferramentas automatizadas para análise estatística com o mínimo de intervenção do usuário.
fonte
A mineração de dados é descobrir padrões ocultos ou conhecimento desconhecido, que podem ser usados para a tomada de decisões pelas pessoas.
O aprendizado de máquina consiste em aprender um modelo para classificar novos objetos.
fonte
Na minha opinião, a Inteligência Artificial pode ser considerada o "superconjunto" de campos como Machine Learning, Mineração de Dados, Reconhecimento de Padrões etc.
Estatística, é um campo da matemática que inclui todos os modelos, técnicas e teoremas matemáticos que estão sendo usados na IA.
O Machine Learning é um campo de IA que inclui todos os algoritmos que aplicam os Modelos Estatísticos mencionados acima e faz sentido dos dados, isto é, análises preditivas, como clustering e classificação.
Data Mining é a ciência que utiliza todas as técnicas acima (principalmente aprendizado de máquina) para extrair padrões úteis e importantes dos dados. A Mineração de Dados geralmente tem a ver com extrair informações úteis de conjuntos de dados massivos, ou seja, Big Data.
fonte
Que tal: ensinar máquinas para aprender
Reconhecer padrões significativos nos dados: mineração de dados
Prever resultados a partir de padrões conhecidos: ML
Encontre novos recursos para remapear dados brutos: AI
Este cérebro de pássaro realmente precisa de definições simples.
fonte
Muitas vezes, a mineração de dados tenta "prever" alguns dados futuros ou "explicar" por que algo acontece.
As estatísticas são mais usadas para validar hipóteses aos meus olhos. Mas esta é uma discussão subjetiva.
Uma diferença óbvia entre estatísticos e mineradores de dados pode ser encontrada no tipo de estatística resumida que eles analisam.
As estatísticas geralmente se limitam ao R² e à precisão, enquanto os mineradores de dados analisam as curvas AUC, ROC, curvas de elevação etc. e também podem se preocupar em empregar uma curva de precisão relacionada a custos.
Os pacotes de mineração de dados (por exemplo, o Weka de código aberto), incorporaram técnicas para seleção de entrada, suportam a classificação de máquinas de vetores, etc., enquanto na maioria das vezes estão ausentes em pacotes estatísticos como o JMP. Recentemente, quando participei de um curso sobre "mineração de dados em jmp" do pessoal do jmp e, embora seja um pacote visualmente forte, algumas técnicas essenciais de pré / pós / meados de mineração de dados estão faltando. A seleção de entrada foi feita manualmente, para obter informações sobre os dados, ainda na mineração de dados, é apenas sua intenção liberar algoritmos, de forma inteligente, em dados grandes e ver automaticamente o que sai. O curso foi obviamente ministrado por pessoas de estatística, que enfatizavam a mentalidade diferente entre os dois.
fonte