Por que a regressão logística é chamada de algoritmo de aprendizado de máquina?

19

Se eu entendi corretamente, em um algoritmo de aprendizado de máquina, o modelo precisa aprender com sua experiência, ou seja, quando o modelo fornece uma previsão errada para os novos casos, ele deve se adaptar às novas observações e, com o tempo, o modelo se torna cada vez melhor. . Não vejo que a regressão logística tenha essa característica. Então, por que ainda é considerado um algoritmo de aprendizado de máquina? Qual é a diferença entre regressão logística e regressão normal em termos de "aprendizado"?

Eu tenho a mesma pergunta para florestas aleatórias!

E qual é a definição de "aprendizado de máquina"?

Metariat
fonte
4
Eu editei sua pergunta para maior clareza gramatical, mas não tenho certeza do que você quer dizer em geral ... A regressão logística se enquadra no ML porque é um algoritmo de classificação. O Machine Learning não implica que o algoritmo precise ser adaptável (embora haja algoritmos que aprendem com novas observações). A adaptação é mais uma opção de implementação, geralmente obtida por algoritmos de aprendizado de máquina generativos que modelam a probabilidade conjunta.
Zhubarb
12
"Aprendizado de máquina" é um conceito pouco definido. Realmente, todos os procedimentos estatísticos que envolvem o ajuste de um modelo podem ser pensados ​​no aprendizado de máquina. (Supondo que o ajuste do modelo possa ser feito por um computador, até certo ponto!). É por isso que alguns get estatístico frustrado com "Big Data", "aprendizagem de máquina", etc comunidades turvando as águas sobre o que as estatísticas é (e não é!)
P.Windridge
1
@ P.Windridge: se "todos os procedimentos estatísticos que envolvem montagem de um modelo pode ser pensado de aprendizagem de máquina", então eu não vejo por que deveríamos distinguir aprendizado de máquina e estatística
Metariat
4
@XuanQuangDO Provavelmente não devemos distinguir aprendizado de máquina e estatística.
Sycorax diz Reinstate Monica

Respostas:

21

Machine Learning não é um termo bem definido.

De fato, se você pesquisar no Google "Machine Learning Definition", as duas primeiras coisas que você recebe são bem diferentes.

De WhatIs.com ,

O aprendizado de máquina é um tipo de inteligência artificial (IA) que fornece aos computadores a capacidade de aprender sem serem explicitamente programados. O aprendizado de máquina se concentra no desenvolvimento de programas de computador que podem aprender a crescer e mudar quando expostos a novos dados.

Na Wikipedia ,

O aprendizado de máquina explora a construção e o estudo de algoritmos que podem aprender e fazer previsões sobre os dados.

A regressão logística, sem dúvida, se encaixa na definição da Wikipedia e você pode argumentar se ela se encaixa ou não na definição WhatIs.

Eu, pessoalmente, defino o Machine Learning da mesma forma que a Wikipedia e o considero um subconjunto de estatísticas.

TrynnaDoStat
fonte
1
Eu concordo com a maior parte do que você disse, exceto que é um subconjunto de estatísticas. Ele tem uma grande sobreposição, mas existem tipos de aprendizado, como o aprendizado por reforço, que não pode realmente ser considerado um subconjunto de estatísticas.
George
2
Essas não são boas fontes.
Neil G
@ George Certo, mas convenhamos, se você tivesse que aplicar um rótulo a todas as metodologias de coleta, análise e modelagem de dados, seja aprendizado de máquina, supervisionado ou não supervisionado, paramétrico ou não paramétrico, são todas estatísticas. ML é um campo especializado em estatística.
robertf
@RobertF Eu discordo. O aprendizado de máquina é o campo que estuda como as máquinas podem aprender. Concordo que a maioria dos métodos usados ​​no ML pode ser considerada estatística, mas o campo não é inerentemente um subcampo da estatística. Por exemplo, não acho que os processos de decisão de Markov sejam considerados métodos estatísticos.
George George
1
@ George George Modelos discretos de Markov são modelos de probabilidade. Depois de estimar parâmetros desconhecidos de um modelo de probabilidade (por exemplo, processos de decisão de Markov), que é a definição do livro didático de um procedimento estatístico. Eu acho que a principal classe de atividades que pode ser chamada de ML e não estatística são aplicações específicas, como a construção de um robô que joga xadrez. Os algoritmos subjacentes, sem dúvida, envolvem probabilidade e estatística, mas o aplicativo não é realmente "estatística". É como a pesquisa genômica usa muito as estatísticas, mas são campos decididamente diferentes.
ahfoss 3/09/16
20

O Machine Learning é quente e é onde está o dinheiro. As pessoas chamam de coisas que estão tentando vender o que está quente no momento e, portanto, "vende". Isso pode estar vendendo software. Isso pode ser vender-se como funcionários atuais tentando ser promovidos, como funcionários em potencial, como consultores etc. Isso pode ser um gerente que tenta obter um orçamento aprovado de um figurão da empresa para contratar pessoas e comprar coisas ou convencer os investidores a investir em sua nova e quente startup, que faz o Machine Learning como a chave para criar um aplicativo de sexting aprimorado. O software faz o Machine Learning e as pessoas são especialistas em Machine Learning, porque é isso que está na moda e, portanto, o que vende ... pelo menos por enquanto.

Eu fiz todos os tipos de modelos estatísticos lineares e não lineares que se encaixavam há mais de 30 anos. Não era chamado Machine Learning na época. Agora, a maior parte seria.

Assim como todos e seu tio são agora um "cientista" de dados. Isso é quente, é supostamente sexy, então é assim que as pessoas se chamam. E é isso que os gerentes de contratação que precisam obter orçamento aprovado para contratar alguém listam posições como. Portanto, alguém que não conhece a primeira coisa sobre matemática, probabilidade, estatística, otimização ou computação numérica / de ponto flutuante, usa um pacote R ou Python de correção e robustez duvidosas de implementação e que é rotulado como um algoritmo de aprendizado de máquina, para aplicar a dados que eles não entendem e se autodenominam Cientistas de Dados com base em sua experiência em fazê-lo.

Isso pode parecer irreverente, mas acredito que seja a essência da situação.

Edit: O seguinte foi twittado em 26 de setembro de 2019:

https://twitter.com/daniela_witten/status/1177294449702928384

Daniela Witten @daniela_witten "Quando arrecadamos dinheiro, é IA, quando contratamos seu aprendizado de máquina e, quando fazemos o trabalho, é uma regressão logística."

(Não tenho certeza de quem criou isso, mas é uma jóia 💎)

Mark L. Stone
fonte
16
Não vou esconder que compartilho algumas dessas opiniões e simpatizo com o resto. No entanto, para serem apropriados como resposta em um site de SE, eles precisam de algum tipo de suporte. Obviamente, isso não será por meio do raciocínio dedutivo: ele deve vir da adição de fatos e / ou da citação de fontes autorizadas. Seria legal se você pudesse fazer isso!
whuber
10
Facilmente o post mais divertido que eu li hoje neste site, e eu concordo com muito dele. Mas tenho que concordar com o @whuber que ele realmente não responde à pergunta em sua forma atual.
Nick Cox
6
Como um pequeno esclarecimento. Eu trabalho no desenvolvimento de software e na "ciência de dados". Eu entrevisto muitas pessoas. A taxa de pessoas entrevistadas para cargos de desenvolvimento de software e cargos de ciência de dados que não têm as habilidades necessárias para fazer o trabalho é praticamente a mesma. Então, o que há de especial no título de ciência de dados? As pessoas vão aumentar suas habilidades em todas as disciplinas técnicas. Tenho certeza de que a troca de pilha de programação tem muitas das mesmas reclamações.
Matthew Drury
7
Isso parece mais um discurso retórico do que uma resposta. Certamente, os nomes mudam, a marca é importante e o aprendizado de máquina é quente (e, portanto, há muitos profissionais autoproclamados que não sabem o que estão fazendo). No entanto, usar isso como argumento para subestimar um campo que se tornou estabelecido e altamente relevante na pesquisa e na indústria me parece barato.
Marc Claesen
7
@ MarkL.Stone Eu entendo sua situação e concordo plenamente que existem muitos termos quentes de inserção incompetentes aqui . No entanto, na minha opinião, o fato de essas pessoas encontrarem (e manterem!) Empregos é culpa da gerência. Se os gerentes não estão satisfeitos com os resultados dos analistas e tratam todos os analistas da mesma forma, independentemente das habilidades / resultados individuais, a gerência é igualmente incompetente como os maus analistas. Qualquer trabalho que cheira a dinheiro tem charlatanismo, tome remédio, por exemplo. Generalizações abrangentes sobre cientistas de dados / pessoal de aprendizado de máquina são tão ruins quanto desconfiar de todos os analistas.
Marc Claesen
18

Como outros já mencionaram, não há uma separação clara entre estatística, aprendizado de máquina, inteligência artificial e assim por diante; portanto, adote qualquer definição com um pouco de sal. A regressão logística provavelmente é mais frequentemente rotulada como estatística do que por aprendizado de máquina, enquanto as redes neurais são rotuladas como aprendizado de máquina (mesmo que as redes neurais sejam frequentemente apenas uma coleção de modelos de regressão logística).

Na minha opinião, o aprendizado de máquina estuda métodos que podem, de alguma forma, aprender com dados, tipicamente construindo um modelo de alguma forma ou forma. A regressão logística, como SVM, redes neurais, florestas aleatórias e muitas outras técnicas, aprende com os dados ao construir o modelo.

Se eu entendi corretamente, em um algoritmo de Machine Learning, o modelo precisa aprender com sua experiência

Não é assim que o aprendizado de máquina é geralmente definido. Nem todos os métodos de aprendizado de máquina produzem modelos que se adaptam dinamicamente a novos dados (esse subcampo é chamado aprendizado online ).

Qual é a diferença entre regressão logística e regressão normal em termos de "aprendizado"?

Muitos métodos de regressão também são classificados como aprendizado de máquina (por exemplo, SVM).

Marc Claesen
fonte
2
Observe que o aprendizado não supervisionado ainda é chamado de aprendizado de máquina; portanto, você não precisa necessariamente ter nenhum loop de feedback para classificar algo como "aprendizado de máquina".
vsz
Isso não está no tópico da pergunta, mas essa resposta também menciona a separação entre AI e ML. Eu sempre gostei desta definição de AI: en.wikipedia.org/wiki/…
Davis Yoshida
10

A regressão logística foi inventada pelo estatístico DR Cox em 1958 e, portanto, antecede o campo do aprendizado de máquina. A regressão logística não é um método de classificação, graças a Deus. É um modelo de probabilidade direta.

Se você acha que um algoritmo precisa ter duas fases (palpite inicial, "corrija" a previsão "erros")) considere o seguinte: A regressão logística acerta na primeira vez. Ou seja, no espaço dos modelos aditivos (no logit). A regressão logística é um concorrente direto de muitos métodos de aprendizado de máquina e supera muitos deles quando os preditores agem principalmente de forma aditiva (ou quando o conhecimento do assunto pré-especifica corretamente as interações). Alguns chamam a regressão logística de um tipo de aprendizado de máquina, mas a maioria não o faria. Você pode chamar alguns métodos estatísticos de métodos de aprendizado de máquina (redes neurais são exemplos).

Frank Harrell
fonte
1
De Funnily Amazon aprendizado de máquina usos de serviços apenas um algoritmo (afaik) - regressão logística - por classificação tarefas: p aws.amazon.com/machine-learning/faqs
stmax
Você pode apenas apresentar os dados de forma incremental - como em um problema de aprendizado on - line . Nesse caso, a regressão logística não "acerta na primeira vez". Eu aprendo progressivamente. Possui uma perda padrão e sua atualização é a aplicação padrão de descida de gradiente. A regressão logística está em todos os livros de aprendizado de máquina que eu já vi.
Neil G
1
β
@FrankHarrell: Certo, e é assim que a estimativa de probabilidade máxima da solução de um problema de regressão logística prossegue.
9605 Neil G
A regressão logística pode anteceder o termo "Machine Learning", mas não antecede o campo : o SNARC foi desenvolvido em 1951 e era uma máquina de aprendizado . Além disso, a insistência de que a regressão logística apenas modela probabilidades e não é, por si só, um classificador, é arrebatadora. Por essa lógica, uma rede neural não é um classificador (a menos que a camada de saída consista em neurônios binários, mas isso tornaria a retropropagação impossível).
Igor F.
8

Vou ter que discordar da maioria das respostas aqui e afirmar que o Machine Learningtem um escopo muito preciso e uma distinção clara das estatísticas. O ML é um subcampo da ciência da computação com uma longa história, que somente nos últimos anos encontrou aplicações fora de seu domínio. O campo paterno e o domínio de aplicativos da ML estão dentro da Inteligência Artificial (robótica, software de reconhecimento de padrões etc.), portanto, não é apenas um "termo quente" como "Big Data" ou "Data Science". A estatística, por outro lado, (que vem da palavra "estado") foi desenvolvida nas ciências sociais e econômicas como uma ferramenta para os seres humanos, não para as máquinas. O ML evoluiu separadamente das estatísticas e, embora em algum momento ao longo do caminho tenha começado a confiar fortemente nos princípios estatísticos, não é de forma alguma um subcampo das estatísticas. ML e estatísticas são campos complementares, não sobrepostos.

Resposta longa :

Como está implícito no seu nome, os métodos ML foram feitos para software / máquinas, enquanto os métodos estatísticos foram feitos para humanos. Tanto o ML quanto as estatísticas lidam com previsões sobre os dados, no entanto, os métodos de ML seguem uma abordagem automatizada não paramétrica, enquanto os métodos estatísticos exigem muito trabalho de construção manual de modelos com um fator explicativo adicional. Isso faz todo o sentido se você considerar que os algoritmos ML foram desenvolvidos na pesquisa de IA como um meio de fazer previsões automatizadas que deveriam ser integradas ao software de robótica (por exemplo, para fins de reconhecimento de voz e rosto). Quando uma "máquina" faz uma previsão, ela não se importa com as razões por trás dela. Uma máquina não se importa em conhecer os drivers / preditores por trás de um modelo que classifica o email como spam ou não spam, apenas se preocupa em ter a melhor precisão de previsão.caixas-pretas , não é porque eles não têm um modelo, é porque o modelo é construído algoritmicamente e não deve ser visível para humanos nem para máquinas.

O conceito de "treinamento" em ML baseia-se no poder computacional, enquanto a construção de modelos estatísticos com métodos do tipo OLS para estimativa de parâmetros depende do conhecimento de um especialista humano. Em um cenário de regressão múltipla, é estritamente do estatístico usar seu julgamento especializado para escolher seu modelo e verificar todas as suposições estatísticas necessárias. O objetivo de um estatístico não é apenas encontrar padrões e usá-los para previsões, mas também entender seus dados e seus problemas em uma profundidade muito maior que a ML.

É claro que em algumas ocasiões o ML e as estatísticas se sobrepõem, como é o caso de muitas disciplinas. A regressão logística é uma dessas ocasiões; originalmente um método estatístico, que tem tanta semelhança com o Perceptron simples (uma das técnicas mais fundamentais de ML), que é visto por alguns como um método de ML.

Digio
fonte
1
Talvez você nunca tenha ouvido falar de estatísticas não paramétricas, modelos estatísticos não paramétricos e construção de modelos?
Mark L. Stone
1
Sim, eu uso estatísticas não paramétricas diariamente. Eu não disse que ML é a resposta não paramétrica às estatísticas, apenas acho que os métodos de ML sendo não paramétricos têm um efeito colateral. A estatística não paramétrica é uma opção alternativa do estatístico quando a estatística paramétrica falha, mas ainda é o resultado da escolha consciente de um especialista. Provavelmente não estou sendo claro o suficiente ao comunicar minha opinião e peço desculpas por isso.
Digio 25/07/2015
3
Há muitos estatísticos que fazem modelos não paramétricos, estatísticas o tempo todo. Você já ouviu falar em Probabilidade empírica - inventada por um estatístico, usada por estatísticos, e bastante não paramétrica, embora também possa ser usada de maneira semi-paramétrica. Então, eu discordo de você, mas não o diminuí.
Mark L. Stone
1
Discordar é bom, Mark, mas ainda não entendo muito bem do que se trata o seu contra-argumento. Você está sugerindo que a estatística não paramétrica não precisa de aprendizado de máquina (algo que nunca neguei)? Ou você está afirmando que o aprendizado de máquina é de fato apenas outro nome para estatísticas não paramétricas (algo que eu neguei)?
Digio 26/07/2015
3
Há muito o que discordar aqui. Modelos de regressão multivariáveis, quando usados ​​em conjunto com ferramentas estatísticas modernas, podem ser flexíveis e altamente competitivos com o ML.
Frank Harrell
3

O aprendizado de máquina é muito pouco definido e você está correto ao pensar que os modelos de regressão - e não apenas os de regressão logística - também "aprendem" com os dados. Não tenho muita certeza se isso significa que o aprendizado de máquina é realmente estatística ou estatística é realmente aprendizado de máquina - ou se algo disso importa.

k

Dito isso, alguns algoritmos aprendem com erros de previsão - isso é particularmente comum no aprendizado por reforço , em que um agente executa alguma ação, observa seu resultado e depois usa o resultado para planejar ações futuras. Por exemplo, um vácuo robótico pode começar com um modelo do mundo em que limpa todos os locais com a mesma frequência e depois aprender a aspirar lugares sujos (onde é "recompensado" por encontrar sujeira) mais e limpar lugares menos.

Algoritmos on-line ou incrementais podem ser atualizados repetidamente com novos dados de treinamento. Isso não depende necessariamente da precisão da previsão do modelo, mas eu poderia imaginar um algoritmo em que os pesos sejam atualizados de forma mais agressiva se, por exemplo, os novos dados parecerem muito improváveis, dado o modelo atual. Existem versões online para regressão logística: por exemplo, McMahan e Streeeter (2012) .

Matt Krause
fonte
3

Eu finalmente descobri. Agora eu sei a diferença entre ajuste estatístico de modelos e aprendizado de máquina.

  • Se você ajusta um modelo (regressão), isso é ajuste de modelo estatístico
  • Se você aprender um modelo (regressão), isso é aprendizado de máquina

Portanto, se você aprender uma regressão logística, esse é um algoritmo de aprendizado de máquina.

Comentário: Perdoe-me por ser um velhote velho, mas sempre que ouço pessoas falando sobre aprender um modelo ou aprender uma regressão, isso me faz pensar em Jethro "Eu aprendi uma educação para mim".

FIM DA LINHA

Mark L. Stone
fonte
??? Eu também posso aprender um modelo de logística. Do que você está falando?
SmallChess
1
@ Estudante T, se você se encaixa em um modelo de logística, isso é ajuste de modelo estatístico. Se você aprende um modelo de logística, isso é aprendizado de máquina. Ou seja, é realmente uma questão de terminologia usada pelos diferentes campos. A mesma coisa pode ser chamada de coisas diferentes por campos diferentes (Estatística e Machine Learning).
Mark L. Stone
0

A regressão logística (e mais geralmente, o GLM) NÃO pertence ao Machine Learning! Em vez disso, esses métodos pertencem à modelagem paramétrica .

Ambos paramétricos modelos e algorítmicos (ML) usam os dados, mas de maneiras diferentes . Modelos algorítmicos aprendem com os dados como os preditores são mapeados para o preditor e, mas eles não assumem o processo que gerou as observações (nem qualquer outro pressuposto, na verdade). Eles consideram que os relacionamentos subjacentes entre as variáveis ​​de entrada e saída são complexos e desconhecidos e, portanto, adotam uma abordagem orientada a dados para entender o que está acontecendo, em vez de impor uma equação formal.

Por outro lado, modelos paramétricos são prescritos a priori com base em algum conhecimento do processo estudado, usam os dados para estimar seus parâmetros e fazem muitas suposições irrealistas que raramente são válidas na prática (como independência, variação igual e Distribuição normal dos erros).

Além disso, modelos paramétricos (como regressão logística) são modelos globais . Eles não podem capturar padrões locais nos dados (diferentemente dos métodos de ML que usam árvores como seus modelos de base, por exemplo, RF ou Boosted Trees). Veja este documento na página 5. Como estratégia de remediação, o GLM local (ou seja, não paramétrico) pode ser usado (consulte, por exemplo, o pacote locfit R).

Freqüentemente, quando há pouco conhecimento sobre o fenômeno subjacente, é melhor adotar uma abordagem orientada a dados e usar modelagem algorítmica. Por exemplo, se você usar regressão logística em um caso em que a interação entre as variáveis ​​de entrada e saída não seja linear, seu modelo será claramente inadequado e muito sinal não será capturado. No entanto, quando o processo é bem compreendido, os modelos paramétricos têm a vantagem de fornecer uma equação formal para resumir tudo, o que é poderoso do ponto de vista teórico.

Para uma discussão mais detalhada, leia este excelente artigo de Leo Breiman.

Antoine
fonte
4
Reserve um tempo para entender a regressão logística. Não faz nenhuma premissa distributiva. Faz exatamente o mesmo tipo de suposição de independência feita por ML. O ML requer tamanhos de amostra muito maiores que a regressão logística. Por exemplo, florestas aleatórias e SVM podem exigir que 200 eventos por recurso candidato sejam estáveis, enquanto a regressão logística normalmente requer 200 eventos por variável candidato.
Frank Harrell
2
Você deve reservar um tempo para entender a regressão logística! É um modelo linear generalizado em que o link é a função de logit. É paramétrico. Parte do princípio de que as observações são da IID. Além disso, boa sorte em capturar relacionamentos não lineares. Além disso, o que significa a segunda parte da sua frase? Para mim, um recurso é uma variável (?)
Antoine
5
Existem muitos bons livros sobre o assunto e eu recomendo que você os consulte antes de prosseguir. A regressão logística não assume distribuições idênticas e, na verdade, não assume nenhuma distribuição. A menos que você possa demonstrar como você considera a estrutura de correlação no ML, as duas abordagens assumem independência. As splines de regressão são usadas desde 1982 para relaxar as suposições de linearidade na regressão logística. Para esta discussão, feature = variable, a menos que expandido em um spline.
Frank Harrell
5
Breiman entendeu as coisas muito bem. Ele simplesmente não lidou com os desenvolvimentos pós-1982 em regressão logística, por exemplo, estimativa de probabilidade máxima penalizada, splines de regressão e combinações com métodos de redução de dados. A única limitação séria à regressão logística é que, como outros métodos, não é bom encontrar as interações corretas se procurarmos por interações e elas não forem pré-especificadas. A maioria dos métodos que pretendem fazer isso não resulta em descobertas replicáveis. Além disso, Breiman usou uma pontuação de precisão inadequada que pode ser otimizada por um modelo falso.
Frank Harrell
3
@ Antonine: "por que a regressão logística difere radicalmente da ML". Observe que alguns métodos no ML (mais notavelmente, SVM) estão muito relacionados à regressão logística. Com exceção de múltiplas interações - como Frank escreveu - o registro logístico com não linearidades e penalização fornece resultados muito semelhantes aos métodos SVM e outros ML. Continua me surpreendendo como alguns documentos citam as melhorias de desempenho baseadas em um método ML versus um modelo logístico stat101 para enquadrar negativamente a regressão logística.
Thomas Speidel
-1

Eu acho que as outras respostas fazem um bom trabalho em identificar mais ou menos o que é Machine Learning (como indicam, pode ser uma coisa imprecisa). Acrescentarei que a Regressão Logística (e sua versão multinomial mais geral) é muito comumente usada como um meio de realizar a classificação em redes neurais artificiais (que eu acho que são inequivocamente cobertas por qualquer definição sensata de aprendizado de máquina que você escolher) e, portanto, se você mencionar Regressão logística para uma pessoa da rede neural, é provável que pensem imediatamente nesse contexto. Ficar preso com um rebatedor pesado no aprendizado de máquina é uma boa maneira de se tornar uma técnica de aprendizado de máquina, e acho que, até certo ponto, foi o que aconteceu com várias técnicas de regressão, embora eu não as desconsidere por serem técnicas apropriadas de aprendizado de máquina em si mesmos.

adamconkey
fonte
Observe que a regressão logística não é um classificador, mas um método de estimativa de probabilidade direta.
Frank Harrell
Para mais informações sobre o ponto do Dr. Harrell, consulte meu post aqui. stats.stackexchange.com/questions/127042/…
Sycorax diz
@FrankHarrell Também podemos usar a probabilidade de classificação, por isso é realmente um classificador.
SmallChess
@ StudentT4 Isso não poderia estar mais incorreto. Se é um estimador de probabilidade direto. A decisão de como você usa o resultado final do modelo logístico é sua. Pela sua lógica, a média da amostra é um classificador.
Frank Harrell
-1

Eu acho que qualquer procedimento "iterativo" pode ser considerado um caso de aprendizado de máquina. A regressão pode ser considerada aprendizado de máquina. Poderíamos fazê-lo manualmente, mas levaria muito tempo, se possível. Então agora temos esses programas, máquinas, que fazem as iterações para nós. Fica cada vez mais perto de uma solução, da melhor solução ou do melhor ajuste. Assim, "aprendizado de máquina". É claro que coisas como redes neurais recebem mais atenção no aprendizado de máquina, por isso geralmente associamos o aprendizado de máquina a esses procedimentos sensuais. Além disso, a diferença entre aprendizado de máquina "supervisionado" e "não supervisionado" é relevante aqui

dailyl
fonte
-2

É um erro muito comum que a maioria das pessoas faz e eu também posso vê-lo aqui (feito por quase todos). Deixe-me explicar em detalhes ... Regressão logística e modelo de regressão linear, ambos são modelo paramétrico, bem como técnica de aprendizado de máquina. Depende apenas do método que você está usando para estimar os parâmetros do modelo (theta). Existem 2 maneiras de encontrar parâmetros de modelo em Regressão Linear e Logística reg.

  1. Técnica de descida de gradiente : Aqui começamos atribuindo valores aleatórios aos parâmetros e localizamos a função de custo (erro). Em cada iteração, atualizamos nossos parâmetros e minimizamos a função de custo. Após um certo número de iterações, a função de custo reduzida aos valores desejados e os valores correspondentes dos parâmetros são nossos valores finais. Isto é o que as técnicas de aprendizado de máquina deveriam fazer. Portanto, se você estiver usando a técnica de Descida de gradiente, a regressão logística poderá chamar como uma técnica de aprendizado de máquina.

  2. Usando o método dos mínimos quadrados: Aqui temos uma fórmula direta para encontrar nossos parâmetros (é necessária alguma álgebra matricial para entender a derivação dessa fórmula), conhecida como equação normal. Least Square Method

Aqui b representa os parâmetros X é o projeto Matrix. Ambos os métodos têm suas próprias vantagens e limitações. Para obter mais detalhes: siga o curso Coursera Machine Learning ainda em execução.

Espero que este post possa ser útil .. :-)

Mohit Kumar
fonte