Qual é a diferença entre aprendizado supervisionado e aprendizado não supervisionado? [fechadas]

283

Em termos de inteligência artificial e aprendizado de máquina, qual é a diferença entre aprendizado supervisionado e não supervisionado? Você pode fornecer uma explicação básica e fácil com um exemplo?

machine-learning artificial-intelligence supervised-learning unsupervised-learning TIMEX
fonte

501

Como você faz essa pergunta muito básica, parece que vale a pena especificar o que é o Machine Learning em si.

O Machine Learning é uma classe de algoritmos orientados por dados, ou seja, diferentemente dos algoritmos "normais", são os dados que "informam" qual é a "boa resposta". Exemplo: um algoritmo hipotético de aprendizado de máquina para detecção de rosto em imagens tentaria definir o que é um rosto (disco redondo com a cor da pele, com área escura onde você espera os olhos, etc.). Um algoritmo de aprendizado de máquina não teria essa definição codificada, mas "aprender-por-exemplos": você mostrará várias imagens de rostos e não-rostos e um bom algoritmo acabará aprendendo e será capaz de prever se é um invisível ou não. imagem é um rosto.

Esse exemplo específico de detecção de rosto é supervisionado , o que significa que seus exemplos devem ser rotulados ou dizer explicitamente quais são os rostos e quais não são.

Em um algoritmo não supervisionado , seus exemplos não são rotulados , ou seja, você não diz nada. É claro que, nesse caso, o próprio algoritmo não pode "inventar" o que é uma face, mas pode tentar agrupar os dados em grupos diferentes, por exemplo, pode distinguir que as faces são muito diferentes das paisagens, muito diferentes dos cavalos.

Como outra resposta a menciona (porém, de maneira incorreta): existem formas "intermediárias" de supervisão, isto é, semi-supervisionadas e aprendizado ativo . Tecnicamente, esses são métodos supervisionados, nos quais existe uma maneira "inteligente" de evitar um grande número de exemplos rotulados. No aprendizado ativo, o próprio algoritmo decide qual coisa você deve rotular (por exemplo, pode ter certeza de uma paisagem e de um cavalo, mas pode solicitar que você confirme se um gorila é realmente a imagem de um rosto). No aprendizado semi-supervisionado, existem dois algoritmos diferentes que começam com os exemplos rotulados e depois "contam" o modo como pensam sobre um grande número de dados não rotulados. Com essa "discussão", eles aprendem.

Davide
fonte

@ChuckTesta Não, isso é totalmente diferente. Também podemos encontrar algumas pesquisas sobre o aprendizado ativo online.

shn

O @ChuckTesta Active Learning é um subconjunto do Online Learning. No caso do aprendizado on-line, o algoritmo recebe dados em uma ordem sequencial (fluxo), em oposição ao aprendizado em lote, onde o algoritmo aprende em todo o conjunto de dados como um todo. Além disso, no aprendizado ativo, o algoritmo decide quais dados de entrada apontam para aprender (consulte seu rótulo no oracle). No caso de restrições de custo de aprendizado (presença de um orçamento de consulta), o aprendizado ativo geralmente supera vários algoritmos de aprendizado on-line.

Greedy Coder

55

Aprendizado supervisionado é quando os dados com os quais você alimenta seu algoritmo são "marcados" ou "rotulados", para ajudar sua lógica a tomar decisões.

Exemplo: filtragem de spam Bayes, em que é necessário sinalizar um item como spam para refinar os resultados.

Aprendizado não supervisionado são tipos de algoritmos que tentam encontrar correlações sem nenhuma entrada externa além dos dados brutos.

Exemplo: algoritmos de cluster de mineração de dados.

Yann Schwartz
fonte

33

Aprendizado supervisionado

Os aplicativos nos quais os dados de treinamento compreendem exemplos dos vetores de entrada, juntamente com seus vetores-alvo correspondentes, são conhecidos como problemas de aprendizado supervisionado.

Aprendizagem não supervisionada

Em outros problemas de reconhecimento de padrões, os dados de treinamento consistem em um conjunto de vetores de entrada x sem nenhum valor-alvo correspondente. O objetivo nesses problemas de aprendizado não supervisionado pode ser descobrir grupos de exemplos semelhantes nos dados, onde é chamado de agrupamento

Reconhecimento de Padrões e Aprendizado de Máquina (Bishop, 2006)

David Robles
fonte

2

Você poderia ilustrar entre vetores de entrada e vetores de destino?

rogue lad

20

No aprendizado supervisionado, a entrada xé fornecida com o resultado esperado y(ou seja, a saída que o modelo deve produzir quando a entrada é x), que geralmente é chamada de "classe" (ou "rótulo") da entrada correspondentex .

No aprendizado não supervisionado, a "classe" de um exemplo x não é fornecida. Portanto, o aprendizado não supervisionado pode ser considerado como encontrar "estrutura oculta" em um conjunto de dados não rotulado.

As abordagens da aprendizagem supervisionada incluem:

Classificação (1R, Naive Bayes, algoritmo de aprendizado da árvore de decisão, como ID3 CART e assim por diante)
Previsão de Valor Numérico

As abordagens para o aprendizado não supervisionado incluem:

Cluster (médias K, cluster hierárquico)
Aprendizagem de Regras de Associação

GPrathap
fonte

13

Por exemplo, muitas vezes o treinamento de uma rede neural é um aprendizado supervisionado: você está dizendo à rede à qual classe corresponde o vetor de recurso que está alimentando.

O armazenamento em cluster é um aprendizado não supervisionado: você deixa o algoritmo decidir como agrupar amostras em classes que compartilham propriedades comuns.

Outro exemplo de aprendizado não supervisionado são os mapas auto-organizados de Kohonen .

Gregory Pakosz
fonte

12

Eu posso te dizer um exemplo.

Suponha que você precise reconhecer qual veículo é um carro e qual é uma motocicleta.

No supervisionado caso de aprendizado , seu conjunto de dados de entrada (treinamento) precisa ser rotulado, ou seja, para cada elemento de entrada no conjunto de dados de entrada (treinamento), você deve especificar se ele representa um carro ou uma motocicleta.

No caso de aprendizado não supervisionado , você não rotula as entradas. O modelo não supervisionado agrupa a entrada em agrupamentos com base, por exemplo, em características / propriedades semelhantes. Portanto, neste caso, não há rótulos como "carro".

mehdi amirsardari
fonte

6

Aprendizado supervisionado

O aprendizado supervisionado é baseado no treinamento de uma amostra de dados da fonte de dados com a classificação correta já atribuída. Tais técnicas são utilizadas nos modelos feedforward ou MultiLayer Perceptron (MLP). Esse MLP possui três características distintas:

Uma ou mais camadas de neurônios ocultos que não fazem parte das camadas de entrada ou saída da rede que permitem à rede aprender e resolver problemas complexos
A não linearidade refletida na atividade neuronal é diferenciável e,
O modelo de interconexão da rede exibe um alto grau de conectividade.

Essas características, juntamente com o aprendizado através do treinamento, resolvem problemas difíceis e diversos. O aprendizado através do treinamento em um modelo de RNA supervisionado também é chamado de algoritmo de retropropagação de erro. O algoritmo de aprendizado de correção de erros treina a rede com base nas amostras de entrada e saída e encontra o sinal de erro, que é a diferença da saída calculada e da saída desejada e ajusta os pesos sinápticos dos neurônios que são proporcionais ao produto do erro sinal e a instância de entrada do peso sináptico. Com base nesse princípio, o aprendizado da propagação de erro ocorre em duas passagens:

Passar para a frente:

Aqui, o vetor de entrada é apresentado à rede. Esse sinal de entrada se propaga para a frente, neurônio por neurônio, através da rede e emerge na extremidade de saída da rede como sinal de saída: y(n) = φ(v(n))onde v(n)é o campo local induzido de um neurônio definido por v(n) =Σ w(n)y(n).A saída que é calculada na camada de saída o (n) é comparado com a resposta desejada d(n)e encontra o erroe(n) para esse neurônio. Os pesos sinápticos da rede durante esse passe permanecem os mesmos.

Retrocesso:

O sinal de erro que é originado no neurônio de saída dessa camada é propagado para trás através da rede. Isso calcula o gradiente local para cada neurônio em cada camada e permite que os pesos sinápticos da rede sofram alterações de acordo com a regra delta, como:

Δw(n) = η * δ(n) * y(n).

Esse cálculo recursivo é continuado, com o encaminhamento seguido pelo retrocesso para cada padrão de entrada até a rede ser convergida.

O paradigma de aprendizado supervisionado de uma RNA é eficiente e encontra soluções para vários problemas lineares e não lineares, como classificação, controle da planta, previsão, previsão, robótica etc.

Aprendizagem não supervisionada

As redes neurais auto-organizadas aprendem usando o algoritmo de aprendizado não supervisionado para identificar padrões ocultos em dados de entrada não rotulados. Isso não supervisionado refere-se à capacidade de aprender e organizar informações sem fornecer um sinal de erro para avaliar a solução em potencial. A falta de orientação para o algoritmo de aprendizado em aprendizado não supervisionado pode às vezes ser vantajosa, pois permite que o algoritmo analise os padrões que não foram considerados anteriormente. As principais características dos mapas auto-organizados (SOM) são:

Ele transforma um padrão de sinal recebido de dimensão arbitrária em um ou mapa bidimensional e executa essa transformação de forma adaptativa
A rede representa a estrutura de feedforward com uma única camada computacional composta por neurônios organizados em linhas e colunas. Em cada estágio da representação, cada sinal de entrada é mantido em seu contexto apropriado e,
Os neurônios que lidam com informações intimamente relacionadas estão próximos e se comunicam através de conexões sinápticas.

A camada computacional também é chamada de camada competitiva, uma vez que os neurônios da camada competem entre si para se tornarem ativos. Portanto, esse algoritmo de aprendizado é chamado de algoritmo competitivo. O algoritmo não supervisionado no SOM funciona em três fases:

Fase de competição:

para cada padrão de entrada x, apresentado à rede, o produto interno com peso sináptico wé calculado e os neurônios na camada competitiva encontram uma função discriminante que induz a competição entre os neurônios e o vetor de peso sináptico que está próximo ao vetor de entrada na distância euclidiana é anunciado como vencedor na competição. Esse neurônio é chamado melhor neurônio correspondente,

i.e. x = arg min ║x - w║.

Fase cooperativa:

o neurônio vencedor determina o centro de uma vizinhança topológica hde neurônios cooperantes. Isso é realizado pela interação lateral dentre os neurônios cooperativos. Esse bairro topológico reduz seu tamanho ao longo de um período de tempo.

Fase adaptativa:

permite que o neurônio vencedor e seus neurônios vizinhos aumentem seus valores individuais da função discriminante em relação ao padrão de entrada por meio de ajustes adequados do peso sináptico,

 Δw = ηh(x)(x –w).

Após a apresentação repetida dos padrões de treinamento, os vetores de peso sinápticos tendem a seguir a distribuição dos padrões de entrada devido à atualização da vizinhança e, assim, a RNA aprende sem supervisor.

O modelo de organização automática representa naturalmente o comportamento neurobiológico e, portanto, é usado em muitas aplicações do mundo real, como clustering, reconhecimento de fala, segmentação de textura, codificação vetorial etc.

Referência.

Sabir Al Fateh
fonte

5

Sempre achei arbitrária e um pouco confusa a distinção entre aprendizado não supervisionado e aprendizado supervisionado. Não há uma distinção real entre os dois casos; em vez disso, há uma série de situações nas quais um algoritmo pode ter mais ou menos 'supervisão'. A existência de aprendizado semi-supervisionado é um exemplo óbvio em que a linha está embaçada.

Costumo pensar em supervisão como dando feedback ao algoritmo sobre quais soluções devem ser preferidas. Para uma configuração supervisionada tradicional, como detecção de spam, você diz ao algoritmo "não cometa erros no conjunto de treinamento" ; para uma configuração tradicional não supervisionada, como clustering, você diz ao algoritmo "pontos que estão próximos um do outro devem estar no mesmo cluster" . Acontece que, a primeira forma de feedback é muito mais específica que a última.

Em resumo, quando alguém diz 'supervisionado', pense em classificação, quando diz 'não supervisionado', pense em agrupar e tente não se preocupar muito com isso além disso.

Stompchicken
fonte

2

A distinção é realmente bem definida e simples. Veja a resposta de David Robles.

5289 bayer

3

Essa definição está correta na medida em que vai, mas é muito estreita. O que se passa com a aprendizagem semi-supervisionada? É supervisionado e não supervisionado. E o condicionamento de um prior na inferência bayesiana? Certamente essa é uma forma de supervisão. E o tipo de inferência usada na tradução automática com um modelo de linguagem (não supervisionado) e um conjunto (de tipo supervisionado?) De pares de sentenças alinhados? 'Supervisão' é apenas outra forma de viés indutivo.

Stompchicken 5/12

1

Entendo o seu ponto e acho bastante interessante. No entanto, eu não me preocuparia tanto. A distinção clássica não supervisionada / supervisionada recebe a maioria dos casos.

Bayer

4

Aprendizado de máquina: explora o estudo e a construção de algoritmos que podem aprender e fazer previsões sobre dados. Esses algoritmos operam construindo um modelo a partir de entradas de exemplo para fazer previsões ou decisões baseadas em dados expressas como saídas, em vez de seguir estritamente estática instruções do programa.

Aprendizado supervisionado: é a tarefa de aprendizado de máquina de deduzir uma função dos dados de treinamento rotulados. Os dados de treinamento consistem em um conjunto de exemplos de treinamento. No aprendizado supervisionado, cada exemplo é um par que consiste em um objeto de entrada (geralmente um vetor) e um valor de saída desejado (também chamado de sinal de supervisão). Um algoritmo de aprendizado supervisionado analisa os dados de treinamento e produz uma função inferida, que pode ser usada para mapear novos exemplos.

O computador é apresentado com exemplos de entradas e as saídas desejadas, fornecidas por um "professor", e o objetivo é aprender uma regra geral que mapeie entradas para saídas. Especificamente, um algoritmo de aprendizado supervisionado utiliza um conjunto conhecido de dados de entrada e respostas conhecidas para os dados (saída) e treina um modelo para gerar previsões razoáveis para a resposta a novos dados.

Aprendizagem não supervisionada: é aprender sem um professor. Uma coisa básica que você pode querer fazer com os dados é visualizá-los. É a tarefa de aprendizado de máquina de inferir uma função para descrever a estrutura oculta de dados não rotulados. Como os exemplos dados ao aluno não são identificados, não há sinal de erro ou recompensa para avaliar uma solução em potencial. Isso diferencia o aprendizado não supervisionado do aprendizado supervisionado. O aprendizado não supervisionado usa procedimentos que tentam encontrar partições naturais de padrões.

Com o aprendizado não supervisionado, não há feedback com base nos resultados da previsão, ou seja, não há professor para corrigi-lo. Sob os métodos de aprendizado não supervisionado, nenhum exemplo rotulado é fornecido e não há noção do resultado durante o processo de aprendizado. Como resultado, cabe ao esquema / modelo de aprendizagem encontrar padrões ou descobrir os grupos dos dados de entrada

Você deve usar métodos de aprendizado não supervisionado quando precisar de uma grande quantidade de dados para treinar seus modelos, vontade e capacidade de experimentar e explorar e, claro, um desafio que não seja bem resolvido por métodos mais estabelecidos. é possível aprender modelos maiores e mais complexos do que com o aprendizado supervisionado. Aqui está um bom exemplo disso

.

Anish Parajuli 웃
fonte

4

Aprendizado supervisionado: digamos que uma criança vá ao jardim de infância. aqui o professor mostra 3 brinquedos-casa, bola e carro. agora o professor lhe dá 10 brinquedos. ele os classificará em 3 caixas de casa, bola e carro com base em sua experiência anterior. então o garoto foi supervisionado pela primeira vez pelos professores para obter respostas certas para alguns conjuntos. então ele foi testado em brinquedos desconhecidos.

Aprendizagem não supervisionada: novamente exemplo do jardim de infância. Uma criança recebe 10 brinquedos. ele é orientado a segmentar outros semelhantes. então, com base em recursos como forma, tamanho, cor, função etc., ele tentará fazer 3 grupos dizer A, B, C e agrupá-los.

A palavra Supervisionar significa que você está supervisionando / instruindo a máquina para ajudá-la a encontrar respostas. Uma vez que ele aprende instruções, ele pode prever facilmente um novo caso.

Não supervisionado significa que não há supervisão ou instrução sobre como encontrar respostas / etiquetas e a máquina usará sua inteligência para encontrar algum padrão em nossos dados. Aqui, ele não fará previsões, apenas tentará encontrar clusters com dados semelhantes.

Ashish Anand
fonte

4

Já existem muitas respostas que explicam as diferenças em detalhes. Encontrei esses gifs na codeacademy e eles geralmente me ajudam a explicar as diferenças de maneira eficaz.

Aprendizado supervisionado

Observe que as imagens de treinamento têm rótulos aqui e que o modelo está aprendendo os nomes das imagens.

Aprendizagem não supervisionada

Observe que o que está sendo feito aqui é apenas agrupamento (clustering) e que o modelo não sabe nada sobre nenhuma imagem.

Arun Sethupat
fonte

4

O algoritmo de aprendizado de uma rede neural pode ser supervisionado ou não supervisionado.

Diz-se que uma rede neural aprende supervisionada se a saída desejada já é conhecida. Exemplo: associação de padrões

As redes neurais que aprendem sem supervisão não têm tais resultados-alvo. Não é possível determinar como será o resultado do processo de aprendizado. Durante o processo de aprendizado, as unidades (valores de peso) dessa rede neural são "organizadas" dentro de um determinado intervalo, dependendo dos valores de entrada fornecidos. O objetivo é agrupar unidades semelhantes próximas em determinadas áreas da faixa de valor. Exemplo: classificação de padrões

Naren Babu R
fonte

3

Aprendizado supervisionado, dados os dados com uma resposta.

Dado o email rotulado como spam / não spam, aprenda um filtro de spam.

Dado um conjunto de dados de pacientes diagnosticados como diabéticos ou não, aprenda a classificar novos pacientes como diabéticos ou não.

O aprendizado não supervisionado, dados os dados sem resposta, permite que o computador agrupe as coisas.

Dado um conjunto de artigos de notícias encontrados na Web, agrupe-os em um conjunto de artigos sobre a mesma história.

Dado um banco de dados de dados personalizados, descubra automaticamente segmentos de mercado e agrupe clientes em diferentes segmentos de mercado.

Referência

caçador
fonte

3

Aprendizado supervisionado

Nesse caso, todo padrão de entrada usado para treinar a rede está associado a um padrão de saída, que é o destino ou o padrão desejado. Presume-se que um professor esteja presente durante o processo de aprendizagem, quando é feita uma comparação entre a saída calculada da rede e a saída esperada correta, para determinar o erro. O erro pode ser usado para alterar os parâmetros da rede, o que resulta em uma melhoria no desempenho.

Aprendizagem não supervisionada

Neste método de aprendizado, a saída de destino não é apresentada à rede. É como se não houvesse professor para apresentar o padrão desejado e, portanto, o sistema aprende por si próprio, descobrindo e adaptando as características estruturais nos padrões de entrada.

coding_ninza
fonte

3

Aprendizado supervisionado : Você fornece dados de exemplo rotulados como entrada, juntamente com as respostas corretas. Esse algoritmo aprenderá com ele e começará a prever resultados corretos com base nas entradas subsequentes. Exemplo : filtro de spam por email

Aprendizado não supervisionado : você apenas fornece dados e não conta nada - como etiquetas ou respostas corretas. O algoritmo analisa automaticamente os padrões nos dados. Exemplo : Google Notícias

disp_name
fonte

3

Vou tentar simplificar.

Aprendizado supervisionado: Nesta técnica de aprendizado, recebemos um conjunto de dados e o sistema já conhece a saída correta do conjunto de dados. Então, aqui, nosso sistema aprende prevendo um valor próprio. Em seguida, ele faz uma verificação de precisão usando uma função de custo para verificar o quão perto sua previsão estava da saída real.

Aprendizado não supervisionado: Nesta abordagem, temos pouco ou nenhum conhecimento de qual seria o nosso resultado. Então, em vez disso, derivamos estrutura dos dados em que não sabemos o efeito da variável. Criamos estrutura agrupando os dados com base no relacionamento entre a variável nos dados. Aqui, não temos um feedback com base em nossa previsão.

vasurb
fonte

2

Aprendizado supervisionado

Você inseriu x e uma saída alvo t. Então você treina o algoritmo para generalizar para as partes ausentes. É supervisionado porque o objetivo é dado. Você é o supervisor que está dizendo ao algoritmo: Para o exemplo x, você deve gerar t!

Aprendizagem não supervisionada

Embora a segmentação, o agrupamento e a compactação sejam geralmente contados nessa direção, é difícil encontrar uma boa definição para isso.

Vamos usar codificadores automáticos para compactação como exemplo. Enquanto você só tem a entrada x, é o engenheiro humano como diz ao algoritmo que o alvo também é x. Portanto, em certo sentido, isso não é diferente do aprendizado supervisionado.

E para cluster e segmentação, não tenho muita certeza se ele realmente se encaixa na definição de aprendizado de máquina (consulte outra pergunta ).

Martin Thoma
fonte

2

Aprendizado supervisionado: você rotulou dados e precisa aprender com isso. por exemplo, dados da casa junto com o preço e, em seguida, aprenda a prever o preço

Aprendizado não supervisionado: você precisa encontrar a tendência e prever, sem rótulos anteriores. por exemplo, pessoas diferentes da turma e, em seguida, uma nova pessoa aparece, de que grupo esse novo aluno pertence.

Asad Mahmood
fonte

1

No Aprendizado Supervisionado , sabemos quais devem ser as entradas e saídas. Por exemplo, dado um conjunto de carros. Temos que descobrir quais são vermelhos e quais são azuis.

Visto que o aprendizado não supervisionado é o local em que precisamos encontrar a resposta com muito pouca ou nenhuma idéia de como deve ser o resultado. Por exemplo, um aluno pode ser capaz de criar um modelo que detecte quando as pessoas estão sorrindo com base na correlação de padrões faciais e palavras como "do que você está sorrindo?".

Buraira Nasir
fonte

1

O aprendizado supervisionado pode rotular um novo item em um dos rótulos treinados, com base no aprendizado durante o treinamento. Você precisa fornecer um grande número de dados de treinamento, dados de validação e dados de teste. Se você fornecer, digamos, vetores de imagem em pixel de dígitos, juntamente com dados de treinamento com etiquetas, ele poderá identificar os números.

A aprendizagem não supervisionada não requer conjuntos de dados de treinamento. No aprendizado não supervisionado, ele pode agrupar itens em diferentes clusters com base na diferença nos vetores de entrada. Se você fornecer vetores de dígitos de imagem em pixel e solicitar a classificação em 10 categorias, poderá fazê-lo. Mas ele sabe como rotulá-lo, pois você não forneceu rótulos de treinamento.

sam getty
fonte

1

O aprendizado supervisionado é basicamente onde você tem variáveis de entrada (x) e variável de saída (y) e usa o algoritmo para aprender a função de mapeamento da entrada para a saída. A razão pela qual chamamos isso de supervisionado é porque o algoritmo aprende com o conjunto de dados de treinamento, que faz iterativamente previsões sobre os dados de treinamento. Supervisionado tem dois tipos - Classificação e Regressão. Classificação é quando a variável de saída é da categoria como sim / não, verdadeiro / falso. Regressão é quando a saída é valores reais, como altura da pessoa, temperatura, etc.

A aprendizagem supervisionada das Nações Unidas é onde apenas temos dados de entrada (X) e nenhuma variável de saída. Isso é chamado de aprendizado não supervisionado porque, diferentemente do aprendizado supervisionado acima, não há respostas corretas e não há professor. Os algoritmos são deixados por conta própria para descobrir e apresentar a estrutura interessante nos dados.

Tipos de aprendizado não supervisionado são agrupamento e associação.

Tyagi.Am
fonte

1

O aprendizado supervisionado é basicamente uma técnica na qual os dados de treinamento a partir dos quais a máquina aprende já estão rotulados, supondo um classificador de número ímpar ímpar, onde você já classificou os dados durante o treinamento. Portanto, ele usa dados "LABELED".

O aprendizado não supervisionado, pelo contrário, é uma técnica na qual a máquina, por si só, rotula os dados. Ou você pode dizer que é o caso quando a máquina aprende sozinha do zero.

sayantan ghosh
fonte

1

No Simple Supervised learning, é o tipo de problema de aprendizado de máquina no qual temos alguns rótulos e, usando esses rótulos, implementamos algoritmos como regressão e classificação. sim não. e regressão é aplicada onde colocar um valor real tal casa de preço

O aprendizado não supervisionado é um tipo de problema de aprendizado de máquina no qual não temos rótulos, significa que temos apenas alguns dados, dados não estruturados e temos que agrupar os dados (agrupamento de dados) usando vários algoritmos não supervisionados

pankaj yadav E DOT TECH
fonte

1

Aprendizado de máquina supervisionado

"O processo de um algoritmo aprendendo com o conjunto de dados de treinamento e prever a saída".

Precisão da produção prevista diretamente proporcional aos dados de treinamento (duração)

O aprendizado supervisionado é onde você tem variáveis de entrada (x) (conjunto de dados de treinamento) e uma variável de saída (Y) (conjunto de dados de teste) e usa um algoritmo para aprender a função de mapeamento da entrada para a saída.

Y = f(X)

Tipos principais:

Classificação (eixo y discreto)
Preditivo (eixo y contínuo)

Algoritmos:

Algoritmos de classificação:

Neural Networks  
Naïve Bayes classifiers  
Fisher linear discriminant  
KNN 
Decision Tree 
Super Vector Machines

Algoritmos preditivos:

Nearest  neighbor  
Linear Regression,Multi Regression

Áreas de aplicação:

Classificando emails como spam
Classificação se o paciente tem doença ou não
Reconhecimento de voz
Preveja o RH selecionar candidato específico ou não
Prever o preço do mercado de ações

praveen kumar bommali
fonte

1

Aprendizado supervisionado :

Um algoritmo de aprendizado supervisionado analisa os dados de treinamento e produz uma função inferida, que pode ser usada para mapear novos exemplos.

Fornecemos dados de treinamento e sabemos a saída correta para uma determinada entrada
Conhecemos a relação entre entrada e saída

Categorias do problema:

Regressão: preveja resultados em uma saída contínua => mapeie as variáveis de entrada para alguma função contínua.

Exemplo:

Dada a foto de uma pessoa, preveja sua idade

Classificação: prever resultados em uma saída discreta => mapear variáveis de entrada em categorias discretas

Exemplo:

Este número é canceroso?

Aprendizagem não supervisionada:

O aprendizado não supervisionado aprende com dados de teste que não foram rotulados, classificados ou categorizados. O aprendizado não supervisionado identifica pontos comuns nos dados e reage com base na presença ou ausência de pontos comuns em cada novo dado.

Podemos derivar essa estrutura agrupando os dados com base nos relacionamentos entre as variáveis nos dados.
Não há feedback com base nos resultados da previsão.

Categorias do problema:

Agrupamento: é a tarefa de agrupar um conjunto de objetos de forma que os objetos do mesmo grupo (chamado cluster) sejam mais semelhantes (em algum sentido) entre si do que os de outros grupos (clusters)

Exemplo:

Pegue uma coleção de 1.000.000 de genes diferentes e encontre uma maneira de agrupar automaticamente esses genes em grupos que são de alguma forma semelhantes ou relacionados por diferentes variáveis, como tempo de vida, local, funções e assim por diante .

Os casos de uso populares estão listados aqui.

Diferença entre classificação e clustering na mineração de dados?

Referências:

Aprendizado supervisionado

Aprendizado não supervisionado

aprendizado de máquina com o Coursera

Para a ciência

Ravindra babu
fonte

1

Aprendizado supervisionado

Aprendizagem não supervisionada

Exemplo:

Aprendizado supervisionado:

Um saco com maçã
Uma bolsa com laranja

=> modelo de construção
Um saco misto de maçã e laranja.

=> Por favor classifique

Aprendizagem não supervisionada:

Um saco misto de maçã e laranja.

=> modelo de construção
Outro saco misto

=> Por favor classifique

Joby Wilson Mathews
fonte

1

Em palavras simples .. :) É do meu entendimento, sinta-se à vontade para corrigir. O aprendizado supervisionado é que sabemos o que estamos prevendo com base nos dados fornecidos. Portanto, temos uma coluna no conjunto de dados que precisa ser predicada. Aprendizagem não supervisionada é que tentamos extrair significado do conjunto de dados fornecido. Não temos clareza sobre o que deve ser previsto. Então, a pergunta é por que fazemos isso? ... :) A resposta é - o resultado do aprendizado não supervisionado são grupos / grupos (dados semelhantes juntos). Portanto, se recebermos novos dados, associaremos isso ao cluster / grupo identificado e entenderemos seus recursos.

Espero que ajude você.

khushal wadake
fonte

1

aprendizado supervisionado

O aprendizado supervisionado é onde conhecemos a saída da entrada bruta, ou seja, os dados são rotulados para que durante o treinamento do modelo de aprendizado de máquina ele entenda o que precisa detectar na saída de saída e guie o sistema durante o treinamento para Ao detectar os objetos pré-rotulados nessa base, ele detectará os objetos semelhantes que fornecemos no treinamento.

Aqui, os algoritmos saberão qual é a estrutura e o padrão dos dados. O aprendizado supervisionado é usado para classificação

Como exemplo, podemos ter objetos diferentes cujas formas são quadradas, circulares, triplo. Nossa tarefa é organizar os mesmos tipos de formas que o conjunto de dados rotulado possui todas as formas rotuladas e treinaremos o modelo de aprendizado de máquina nesse conjunto de dados, em Com base no conjunto de datas do treinamento, ele começará a detectar as formas.

Aprendizagem não supervisionada

O aprendizado não supervisionado é um aprendizado não guiado, onde o resultado final não é conhecido, ele agrupará o conjunto de dados e, com base em propriedades semelhantes do objeto, dividirá os objetos em diferentes grupos e detectará os objetos.

Aqui, os algoritmos procurarão o padrão diferente nos dados brutos e, com base nisso, agruparão os dados. O aprendizado não supervisionado é usado para agrupar.

Como exemplo, podemos ter diferentes objetos de várias formas: quadrado, círculo, triângulo, de modo que os agrupamentos sejam baseados nas propriedades do objeto; se um objeto tiver quatro lados, ele será considerado quadrado; e, se tiver três lados, triângulo e se não houver lados além do círculo, aqui os dados não são rotulados, eles aprenderão a detectar as várias formas

Amit Agrawal
fonte

1

O aprendizado de máquina é um campo em que você está tentando fazer com que a máquina imite o comportamento humano.

Você treina máquinas como um bebê. A maneira como os humanos aprendem, identificam recursos, reconhecem padrões e treinam a si mesmos, da mesma forma que você treina máquinas alimentando dados com vários recursos. O algoritmo da máquina identifica o padrão nos dados e classifica-o em uma categoria específica.

Aprendizado de máquina amplamente dividido em duas categorias: aprendizado supervisionado e não supervisionado.

Aprendizado supervisionado é o conceito em que você tem vetor / dados de entrada com o valor-alvo correspondente (saída). Por outro lado, aprendizado não supervisionado é o conceito em que você só tem vetores / dados de entrada sem o valor-alvo correspondente.

Um exemplo de aprendizado supervisionado é o reconhecimento de dígitos manuscritos, onde você tem uma imagem de dígitos com o dígito correspondente [0-9], e um exemplo de aprendizado não supervisionado está agrupando os clientes pelo comportamento de compra.

SOL
fonte

Qual é a diferença entre aprendizado supervisionado e aprendizado não supervisionado? [fechadas]

Respostas:

Aprendizado supervisionado

Aprendizagem não supervisionada

Aprendizado supervisionado

Aprendizagem não supervisionada

Aprendizado supervisionado

Aprendizagem não supervisionada