Quando a regressão linear deve ser chamada de "aprendizado de máquina"?

90

Em um colóquio recente, o resumo do orador alegou que eles estavam usando aprendizado de máquina. Durante a palestra, a única coisa relacionada ao aprendizado de máquina foi que eles realizam regressão linear em seus dados. Depois de calcular os coeficientes de melhor ajuste no espaço de parâmetros 5D, eles compararam esses coeficientes em um sistema com os coeficientes de melhor ajuste de outros sistemas.

Quando é o aprendizado de máquina de regressão linear , em vez de simplesmente encontrar uma linha de melhor ajuste? (O resumo do pesquisador foi enganoso?)

Com toda a atenção que o aprendizado de máquina vem conquistando recentemente, parece importante fazer essas distinções.

Minha pergunta é como esta , exceto que essa pergunta pede a definição de "regressão linear", enquanto a minha pergunta quando a regressão linear (que possui um grande número de aplicações) pode ser apropriadamente chamada de "aprendizado de máquina".

Esclarecimentos

Não estou perguntando quando regressão linear é a mesma que aprendizado de máquina. Como alguns apontaram, um único algoritmo não constitui um campo de estudo. Eu estou perguntando quando é correto dizer que alguém está fazendo aprendizado de máquina quando o algoritmo que está usando é simplesmente uma regressão linear.

Todas as piadas de lado (veja os comentários), uma das razões pelas quais pergunto isso é porque não é ético dizer que alguém está aprendendo a máquina para adicionar algumas estrelas douradas ao seu nome, se elas não estão realmente aprendendo. (Muitos cientistas calculam algum tipo de linha que melhor se ajusta ao seu trabalho, mas isso não significa que eles estejam praticando o aprendizado de máquina.) Por outro lado, há claramente situações em que a regressão linear está sendo usada como parte do aprendizado de máquina. Estou procurando especialistas para me ajudar a classificar essas situações. ;-)

jvriesem
fonte
13
Talvez você queira ver o tópico: " As duas culturas: estatística versus aprendizado de máquina? ".
usεr11852
75
Você deve renomear sua regressão como 'aprendizado de máquina' sempre que quiser duplicar as taxas na sua tabela de preços.
Sycorax
3
Há uma diferença. Aprender é um processo. Um melhor ajuste é um objetivo. Veja minha resposta abaixo. Francamente, as palavras não têm o mesmo significado, embora possam aparecer no mesmo contexto, como "os pássaros voam", pode-se associar os dois, mas os pássaros não voam, e embora voar seja para os pássaros, é para F -18 caças também.
211 Carl Carl
20
@Sycorax e aprendizagem profunda quando você quer quadruplicar
Franck Dernoncourt
11
@FranckDernoncourt "Sou um cientista de dados que usa aprendizado profundo em ambiente de big data para resolver problemas de aprendizado de máquina" soa como um bom cabeçalho para o perfil do LinkedIn;)
Tim

Respostas:

78

Respondendo à sua pergunta com uma pergunta: o que exatamente é o aprendizado de máquina? Trevor Hastie, Robert Tibshirani e Jerome Friedman em Os Elementos do Aprendizado Estatístico , Kevin P. Murphy em Aprendizado de Máquina Uma Perspectiva Probabilística , Christopher Bishop em Reconhecimento de Padrões e Aprendizado de Máquina , Ian Goodfellow, Yoshua Bengio e Aaron Courville em Deep Learning e vários outras "bíblias" de aprendizado de máquina mencionam a regressão linear como um dos "algoritmos" de aprendizado de máquina. O aprendizado de máquina é em parte um chavão para as estatísticas aplicadas, e a distinção entre estatística e aprendizado de máquina é muitas vezes embaçada.

Tim
fonte
4
É verdade, mas em grande parte são disciplinas isoladas com grandes quantidades de literatura, métodos e algoritmos não sobrepostos. Por exemplo, no mundo atual de aprendizado de máquina, os graduados em dados e ciência da computação estão muito à frente dos candidatos a estatística em termos de financiamento, subsídios e oportunidades de trabalho, você escolhe.
Mike Hunter
6
@Johnson, por isso é aplicada as estatísticas com o novo pacote, vendido a um preço mais alto ..? Eu não acho que o fato de estar na moda não a torne um chavão. As estatísticas bayesianas também têm seus próprios métodos, periódicos, conferências, manuais e aplicativos que não se sobrepõem parcialmente às estatísticas clássicas - isso a torna uma disciplina distinta da estatística?
Tim
3
Sim. Negligenciei em ressaltar minha observação sobre os praticantes de ML com a observação mais geral de que praticantes isolados e focados são endêmicos em todos os campos e profissões, não apenas em ML. É um tipo de risco ocupacional - leia a falha humana - que as pessoas aumentam a visão de informações fora de suas necessidades e interesses imediatos. O CV não é exceção a isso.
Mike Hunter
23
(+1) Concordo que não há distinção clara. Na medida em que penso nas diferenças, normalmente considero o ML mais preocupado com as previsões e as estatísticas mais preocupadas com a inferência de parâmetros (por exemplo, o projeto experimental para modelagem da superfície de resposta não seria típico no ML?). Então, nesse sentido, o exemplo OP - onde os coeficientes de regressão parecem ser de maior preocupação - (?) Seria mais "estatísticas-like"
GeoMatt22
3
Veja também As duas culturas de Leo Breiman, que fazem um argumento semelhante ao de @ GeoMatt22: ML concentra-se em previsões precisas. Se o modelo é verdadeiro não é importante. A estatística clássica está procurando o modelo "verdadeiro", em algum sentido, ou pelo menos um modelo que forneça algumas dicas sobre os processos que produziram os dados.
Peter
41

A regressão linear é definitivamente um algoritmo que pode ser usado no aprendizado de máquina. Mas, reductio ad absurdum : qualquer pessoa com uma cópia do Excel pode ajustar-se a um modelo linear.

Mesmo nos restringindo a modelos lineares, há mais algumas coisas a considerar ao discutir o aprendizado de máquina:

  • O aprendizado de máquina em problemas de negócios pode envolver muito mais dados. " Big data ", se você quiser usar a palavra da moda. Limpar e preparar os dados pode levar mais trabalho do que a modelagem real. E quando o volume de dados excede a capacidade de uma única máquina para processá-los, os desafios de engenharia são tão significativos quanto os desafios estatísticos. (Regra geral: se ele se encaixa na memória principal, não é big data).
  • O aprendizado de máquina geralmente envolve muito mais variáveis ​​explicativas (características) do que os modelos estatísticos tradicionais. Talvez dezenas, às vezes até centenas delas, algumas das quais serão variáveis ​​categóricas com muitos níveis. Quando esses recursos podem interagir potencialmente (por exemplo, em um modelo de efeitos cruzados), o número de modelos em potencial a serem ajustados cresce rapidamente.
  • O praticante de aprendizado de máquina geralmente está menos preocupado com o significado dos recursos individuais e mais preocupado em extrair o máximo de poder preditivo possível de um modelo, usando qualquer combinação de recursos que o faça. (Os valores P estão associados à explicação, não à previsão.)
  • Com um grande número de recursos e várias maneiras de projetar esses recursos, a seleção manual de modelos se torna inviável. Na minha opinião, o verdadeiro desafio no aprendizado de máquina é a seleção automatizada de recursos (engenharia de recursos) e outros aspectos da especificação de modelos. Com um modelo linear, existem várias maneiras de fazer isso, geralmente variantes da força bruta; incluindo regressão passo a passo, eliminação traseira etc., todos os quais novamente exigem um poder computacional significativo. (Segunda regra geral: se você estiver selecionando recursos manualmente, está fazendo estatísticas, não aprendizado de máquina).
  • Quando você ajusta automaticamente muitos modelos com muitos recursos, o ajuste excessivo é um problema potencial sério. Lidar com esse problema geralmente envolve alguma forma de validação cruzada : ou seja, mais computação de força bruta!

A resposta curta, do meu ponto de vista, é que onde o aprendizado de máquina se desvia da modelagem estatística tradicional é na aplicação de força bruta e abordagens numéricas para a seleção de modelos, especialmente em domínios com uma grande quantidade de dados e um grande número de variáveis ​​explicativas , com foco no poder preditivo, seguido por mais força bruta para validação do modelo.

david25272
fonte
2
Eu gosto dessa distinção em geral. No entanto, a validação cruzada é usada em modelos "estatísticos" ou isso raramente é necessário, pois normalmente é feito à mão? A engenharia de recursos é considerada estatística então como é feita manualmente?
josh
3
@josh, sim, pode ser. Mas se você olhar para a tag de validação cruzada, quase todas as perguntas são sobre modelagem preditiva.
david25272
@ david25272 Gostaria de saber como você pensa nos testes de autoinicialização, .632+ e auto-permutação - sempre pensei neles como mais "estatísticas aplicadas" do que "aprendizado de máquina" por causa de como são motivados, mas eles são similarmente "força bruta" para validar cruzadamente k-fold ou k-out-k-out. Eu acho que L1 regularização também pode ser pensado como um tipo de seleção de recursos dentro de um quadro estatístico ...
Patrick B.
@Patrick stats.stackexchange.com/questions/18348 é uma resposta melhor sobre os usos do boottapping para validação de modelo do que eu poderia dar.
david25272
@ david25272 ah, desculpe, minha pergunta era mais se você pensa nelas como técnicas de "aprendizado de máquina" ou técnicas de "estatística aplicada", uma vez que são estatisticamente motivadas, mas também "força bruta". Estou familiarizado com o uso de autoinicializações corrigidas por viés para validação de modelo.
Patrick B.
14

Penso que a definição de Mitchell fornece uma maneira útil de fundamentar a discussão sobre aprendizado de máquina, uma espécie de primeiro princípio. Conforme reproduzido na Wikipedia :

Diz-se que um programa de computador aprende com a experiência E em relação a alguma classe de tarefas T e medida de desempenho P, se seu desempenho nas tarefas em T, medido por P, melhorar com a experiência E.

Isso é útil de algumas maneiras. Primeiro, para sua pergunta imediata: Regressão é aprendizado de máquina quando sua tarefa é fornecer um valor estimado a partir de recursos preditivos em algum aplicativo. Seu desempenho deve melhorar, conforme medido pela média do quadrado (ou absoluto, etc.), quando ocorre mais dados.

Segundo, ajuda a delinear o aprendizado de máquina a partir de termos relacionados e seu uso como um chavão de marketing. Compare a tarefa acima com uma regressão inferencial padrão, na qual um analista interpreta os coeficientes para relacionamentos significativos. Aqui, o programa retorna um resumo: coeficientes, valores-p etc. Não se pode dizer que o programa melhore esse desempenho com a experiência; a tarefa é um cálculo elaborado.

Por fim, ajuda a unificar os subcampos do aprendizado de máquina, ambos aqueles comumente usados ​​na exposição introdutória (supervisionada, não supervisionada) com outros, como aprendizado por reforço ou estimativa de densidade. (Cada um tem uma tarefa, medida de desempenho e conceito de experiência, se você pensar neles o suficiente.) Fornece, penso eu, uma definição mais rica que ajuda a delinear os dois campos sem reduzir desnecessariamente qualquer um. Como exemplo, "ML é para previsão, estatística para inferência" ignora as técnicas de aprendizado de máquina fora do aprendizado supervisionado e as técnicas estatísticas que se concentram na previsão.

Sean Easter
fonte
12

Não há lei que diga que um marceneiro não pode usar uma serra de marceneiro.

Aprendizado de máquina e estatística são rótulos vagos, mas se bem definido, há muita sobreposição entre estatística e aprendizado de máquina. E isso vale para os métodos dessas duas áreas, bem como (e separadamente) para as pessoas que se rotulam com essas duas áreas. Mas, no que diz respeito à matemática, o aprendizado de máquina está inteiramente dentro do campo da estatística.

A regressão linear é um procedimento matemático muito bem definido. Costumo associá-lo à área de estatística e às pessoas que se autodenominam 'estatísticos' e àquelas que saem de programas acadêmicos com rótulos como 'estatística'. O SVM (Support Vector Machines) também é um procedimento matemático muito bem definido que possui algumas entradas e saídas semelhantes e resolve problemas semelhantes. Porém, costumo associá-lo à área de aprendizado de máquina e às pessoas que se autodenominam cientistas da computação ou pessoas que trabalham em inteligência artificial ou aprendizado de máquina, que tendem a ser consideradas parte da ciência da computação como disciplina.

Mas alguns estatísticos podem usar SVM e algumas pessoas de IA usam regressão logística. Só para esclarecer, é mais provável que um estatístico ou pesquisador de IA desenvolva um método do que realmente o use em prática.

Coloquei todos os métodos de aprendizado de máquina diretamente dentro do domínio da estatística. Mesmo coisas recentes como Deep Learning, RNNs, CNNs, LSTMs, CRFs. Um estatístico aplicado (bioestatístico, agrônomo) pode muito bem não estar familiarizado com eles. Todos esses são métodos de modelagem preditiva geralmente rotulados com 'aprendizado de máquina' e raramente associados a estatísticas. Mas eles são modelos preditivos, com a possibilidade de serem julgados usando métodos estatísticos.

No final, a regressão logística deve ser considerada parte do aprendizado de máquina.

Mas sim, eu vejo e sempre compartilho seu desagrado pela aplicação incorreta dessas palavras. A regressão linear é uma parte tão fundamental das coisas chamadas estatísticas que parece muito estranho e enganoso chamar seu uso de 'aprendizado de máquina' .

Para ilustrar, a regressão logística é matematicamente idêntica a uma rede de Deep Learning sem nós ocultos e a função logística como a função de ativação para o nó de saída único. Eu não chamaria a regressão logística de método de aprendizado de máquina, mas certamente é usado em contextos de aprendizado de máquina.

É principalmente uma questão de expectativa.

R: "Usei o aprendizado de máquina para prever a readmissão em um hospital após uma cirurgia cardíaca".

B: "Ah, é? Aprendizagem Profunda? Florestas Aleatórias? !!?"

A: "Oh, não, nada tão chique como isso, apenas regressão logística."

B: olhar extremamente decepcionado .

É como dizer, ao lavar uma janela com água que você está usando química quântica. Bem, sim, claro que isso não está tecnicamente errado, mas você está implicando muito mais do que o necessário.

Mas, na verdade, essa é exatamente uma diferença cultural versus uma diferença de substância. As conotações de uma palavra e associações com grupos de pessoas (LR não é totalmente ML!) Versus matemática e aplicações (LR é totalmente ML!).

Mitch
fonte
3
Regressão logística também é muito semelhante, tanto prática como teoricamente, para SVMs: web.stanford.edu/~hastie/Papers/svmtalk.pdf
Patrick B.
3

A visão comum é que o aprendizado de máquina é composto por 4 áreas:

1) Redução de dimensionalidade

2) Agrupamento

3) Classificação

4) Regressão

Regressão linear é uma regressão. Depois que o modelo é treinado, ele pode ser usado para previsões, como qualquer outra, digamos, Regressão aleatória da floresta.

Akavall
fonte
Na verdade, há uma diferença, embora a regressão linear possa ser resolvida usando o aprendizado de máquina. Um alvo de regressão comum são os mínimos quadrados comuns, o que significa que nossa função de perda de objetivo, soma os resíduos ao quadrado, deve ser minimizada. Agora, o aprendizado de máquina se referiria simplesmente àquele método pelo qual minimizamos uma função de perda.
Carl
Assim, conceitualmente, a regressão linear via descida em gradiente (aprendizado) escolhe resíduos quadrados melhores e melhores somados (função de perda). Os conceitos básicos são os mesmos para algoritmos de aprendizado muito mais avançados, como redes neurais. Esses algoritmos simplesmente substituem o modelo linear por um modelo muito mais complexo - e, correspondentemente, por uma função de custo muito mais complexa. .
211 Carl Carl
1
Portanto, a resposta para a pergunta do OP Quando é o aprendizado de máquina de regressão linear, em vez de simplesmente encontrar uma linha de melhor ajuste? Quando a regressão linear é realizada usando um elemento definível do aprendizado de máquina, como descida em gradiente , é então a regressão linear realizada usando o aprendizado de máquina.
211 Carl Carl
5
@ Carl, o problema aqui definido por "aprendizado de máquina". Para mim, se pudermos usar um modelo estatístico, e esse modelo teria capacidade de prever que é aprendizado de máquina. E não importa qual abordagem foi usada para encontrar os coeficientes do modelo.
Akavall 21/03
1
Achei a resposta de Akavall bastante clara. Acredito que o problema de Akavall é que a definição que você apresenta é circular, porque parece resumir-se a "Q: quando a técnica X conta como 'aprendizado de máquina'? R: quando a técnica X é realizada usando um elemento definível do aprendizado de máquina". (Infelizmente eu não entendo o segundo ponto que você está fazendo, então não posso responder a isso.)
Patrick B.
2

A regressão linear é uma técnica, enquanto o aprendizado de máquina é uma meta que pode ser alcançada por diferentes meios e técnicas.

Portanto, o desempenho da regressão é medido pelo quão próximo ele se ajusta a uma linha / curva esperada, enquanto o aprendizado de máquina é medido pelo quão bom ele pode resolver um determinado problema, com os meios necessários.

Esperançosamente útil
fonte
2

Argumentarei que a distinção entre aprendizado de máquina e inferência estatística é clara. Em resumo, aprendizado de máquina = previsão de observações futuras ; estatística = explicação.

Aqui está um exemplo do meu campo de interesse (medicina): ao desenvolver um medicamento, procuramos o (s) gene (s) que melhor explicam um estado da doença, com o objetivo de direcioná-lo ao medicamento. Usamos statistis para isso. Por outro lado, ao desenvolver testes de diagnóstico, por exemplo, prever se a droga ajudará um paciente, o objetivo é encontrar estritamente o melhor preditor do resultado futuro, mesmo que compreenda muitos genes e seja muito complicado de entender. Usamos o aprendizado de máquina para esse fim. Existem vários exemplos publicados [1], [2], [3], [4] mostrando que a presença do alvo da droga não é um bom preditor do resultado do tratamento, daí a distinção.

Com base nisso, é justo dizer que se está fazendo um aprendizado de máquina quando o objetivo é prever estritamente o resultado de observações futuras / nunca vistas antes. Se o objetivo é entender um fenômeno específico, isso é inferência estatística, não aprendizado de máquina. Como outros já apontaram, isso é verdade independentemente do método envolvido.

Para responder à sua pergunta: na pesquisa específica que você descreve, os cientistas compararam os papéis dos fatores (pesos) em diferentes modelos de regressão linear, não comparando a precisão do modelo. Portanto, não é preciso chamar o aprendizado de máquina de inferência.

[1] Messersmith WA, DJ de Ahnen. Alvo EGFR no câncer colorretal. O novo jornal inglês de medicina; 2008; 359; 17

[2] Pogue-Geile KL et al. Prevendo o grau de benefício do trastuzumabe adjuvante no ensaio NSABP B-31. J Natl Cancer Inst; 2013; 105: 1782-1788.

[3] Pazdur R. Aprovação da FDA para Vemurafenib. https://www.cancer.gov/about-cancer/treatment/drugs/fda-vemurafenib . Atualizado em 3 de julho de 2013.

[4] Ray T. Dois estudos da ASCO mostram o desafio de usar a sinalização MET como marcador preditivo em ensaios clínicos com drogas NSCLC. GenomeWeb, 11 de junho de 2014.

ljubomir
fonte
7
Concordo que a pesquisa de aprendizado de máquina tem uma ênfase muito mais pesada nas previsões sobre a estimativa de parâmetros. Mas essa não é uma linha divisória clara: a pesquisa estatística é rica em métodos preditivos.
Cliff AB
4
Então, o que dizer dos estatísticos que fizeram previsões antes da existência dos computadores (ou estavam amplamente disponíveis)? Eles estavam aplicando aprendizado de máquina com papel e lápis ?!
Tim
1
@ Tim: argumento muito bom. Acredito que a resposta é afirmativa se eles se concentrassem em observações futuras, embora reconheça que, nesses casos (raros), o nome aprendizagem estatística seria mais apropriado. Com o advento dos computadores, o termo aprendizado de máquina tornou-se mais moderno. A questão não é o nome, nem o uso de computadores; é a clareza de propósito. Na minha opinião, é quase impossível otimizar com êxito tanto a previsão precisa de observações inéditas quanto a compreensão do fenômeno. Melhor focar adequadamente.
Ljubomir 22/03
4
A previsão de séries temporais (previsão de observação futura) foi um problema popular em estatística (e econometria), por isso não concordo com uma distinção clara com base nisso.
Richard Hardy
1
Esta resposta é falsa. A previsão é apenas uma pequena parte do aprendizado de máquina. Estatísticos também fazem previsões. Embora seja difícil delinear entre aprendizado de máquina e estatística, essa definitivamente não é a maneira correta.
robguinness
2

Pode ser útil chamar aprendizado de máquina por regressão linear, porque isso geralmente implica algumas coisas importantes sobre como você resolveu seu problema:

  1. Você decidiu que não era necessário verificar suposições causais e teoria prévia por trás de suas variáveis ​​explicativas. Isso indica que seu modelo não teve a intenção de explicar, mas de prever. Isso é perfeitamente razoável em muitas configurações, por exemplo, prevendo spam de email com base em palavras-chave. Não há realmente muita literatura sobre quais palavras predizem spam, e há tantas que não faz sentido pensar no significado teórico de cada palavra.
  2. Você não verificou a significância da variável ou usou valores-p, mas provavelmente optou por um conjunto de validação ou validação cruzada para avaliar o desempenho preditivo fora da amostra. Isso pode ser perfeitamente válido se - voltando ao exemplo de spam de e-mail - se realmente tudo o que você se importa é produzir um modelo que efetivamente preveja spam, mesmo que isso acarrete o custo de incluir variáveis ​​que podem não passar nos testes de significância tradicionais.

No entanto, se o seu modelo tem mais a intenção de explicar do que prever, e você verifica rigorosamente as suposições causais teóricas do seu modelo, etc., sim, é uma tolice chamá-lo de aprendizado de máquina.

Ryan Zotti
fonte
2

É certo que qualquer resposta a esta pergunta é mais opinião do que fato objetivo, mas tentarei explicar minha lógica por que acho que a resposta nunca é . Qualquer especialista ou instrutor de aprendizado de máquina apenas revela sua ignorância ao representar a regressão linear como tal.

O delineamento de disciplinas acadêmicas é mais o delineamento de comunidades do que métodos. Disciplinas científicas emprestam métodos entre disciplinas o tempo todo. Além disso, no século 19 (quando a regressão linear foi desenvolvida) e antes disso, as disciplinas científicas não eram tão claramente delineadas como são hoje. Portanto, particularmente quando os métodos foram desenvolvidos no século XIX ou anterior, devemos ter o cuidado de atribuí-los a uma disciplina específica.

Dito isto, podemos observar a história de uma disciplina e concluir razoavelmente que métodos específicos "pertencem" a uma disciplina ou a outra. Ninguém diria hoje que o cálculo pertence ao campo da física, embora Newton, um dos inventores do cálculo, estivesse definitivamente tentando aplicar isso à física. O cálculo claramente pertence à disciplina da matemática, não da física. Isso ocorre porque o cálculo é um método matemático geral que pode ser usado completamente fora dos contextos da física.

Pelo mesmo raciocínio, a regressão linear pertence à disciplina de estatística, embora seja comumente usada como um exemplo simples de ajuste de dados a um modelo no contexto de aprendizado de máquina. Assim como o cálculo pode ser usado fora do contexto da física, a regressão linear pode (e é) usada fora do contexto do aprendizado de máquina.

Os instrutores de aprendizado de máquina seriam sábios em apontar que a regressão linear está em uso desde o final do século 19, muito antes de a noção moderna de aprendizado de máquina surgir. Eles também devem enfatizar que o aprendizado de máquina utiliza muitos conceitos de probabilidade e estatística, além de outras disciplinas (por exemplo, teoria da informação). No entanto, esses conceitos não representam eles próprios o aprendizado de máquina ou um "algoritmo" de aprendizado de máquina.

robguinness
fonte
1

É a máquina, estúpido!

Não sou estatístico nem especialista em Big Data (TM). No entanto, eu diria que a distinção essencial é que o "aprendizado de máquina" requer "uma máquina". Em particular, implica agência . O resultado não será consumido sem pressa por um ser humano. Em vez disso, o resultado será a entrada para um ciclo fechado pelo qual um sistema automatizado melhora seu desempenho.

Sistema fechado

Isso está muito de acordo com a resposta de Sean Easter, mas eu só quero enfatizar que, em aplicações comerciais, uma máquina está observando os resultados e atuando neles . Um exemplo clássico é o algoritmo CineMatch, que foi o alvo do Prêmio Netflix. Um ser humano pode olhar para a saída do CineMatch e aprender recursos interessantes sobre os telespectadores. Mas não é por isso que existe. O objetivo do CineMatch é fornecer um mecanismo pelo qual os servidores da Netflix possam sugerir filmes para os clientes que eles irão gostar. A saída do modelo estatístico vai para o serviço de recomendação, que em última análise produz mais informações à medida que os clientes classificam os filmes, alguns dos quais foram selecionados por recomendação do CineMatch.

Sistema aberto

Por outro lado, se um pesquisador usa um algoritmo para produzir resultados estatísticos que são exibidos em uma apresentação a outros seres humanos, então esse pesquisador não está decididamente envolvido em aprendizado de máquina . Isso é, obviamente, para mim, aprendizado humano . A análise é realizada por uma máquina, mas não é uma máquina que está aprendendo , por si só. Agora, é "aprendizado de máquina", na medida em que um cérebro humano não experimentou todas as entradas da amostra e derivou os resultados estatísticos "biologicamente". Mas eu chamaria isso de "estatística" porque é exatamente isso que os estatísticos vêm fazendo desde que o campo foi inventado.

Conclusão

Assim, eu responderia a essa pergunta perguntando: "Quem consome os resultados?" Se a resposta é: "humanos", então são "estatísticas". Se a resposta for: "software", então é "aprendizado de máquina". E quando dizemos que "o software consome os resultados", não queremos dizer que o armazene em algum lugar para recuperação posterior. Queremos dizer que ele executa um comportamento que é determinado pelos resultados em um loop fechado .

Homem cortador de grama
fonte
8
Este é um ponto razoável, mas acho que, na prática, os modelos de ML geralmente são entregues às pessoas para interpretar e trabalhar.
gung
1
Eu diria que é porque o ML, como campo, gerou uma variedade de ferramentas úteis alavancadas por estatísticos , mesmo que não seja assim que eles querem se chamar, para fins de marketing. ;)
Lawnmower Man
Concordo plenamente com o @gung; Semelhante a outras respostas, concordo que essa é mais frequentemente a motivação para as pessoas que se autodenominam "pesquisadores de ML", que definitivamente não é uma linha definidora. Dois exemplos contrários: os sistemas de recomendação são considerados uma área de pesquisa de BC, mas os resultados são fornecidos diretamente a um ser humano. Os filtros Kalman são frequentemente usados ​​na navegação para piloto automático, sem humanos no circuito, mas geralmente são considerados uma metodologia estatística.
Cliff AB
-1

Na minha opinião, pode-se falar de aprendizado de máquina quando uma máquina é programada para inferir parâmetros de algum modelo usando alguns dados.

Se uma regressão linear é feita por máquina, ela é qualificada.

Se feito à mão, não será.

Definições que dependem da prevalência de algum agente (como o Excel) ou melhoria iterativa (como sugere Sean Easter acima), de alguma forma tentar separá-lo das estatísticas ou dependendo do que fazer com os resultados serão inconsistentes, na minha opinião.

Ytsen de Boer
fonte
3
Então, se você calcular a regressão, ou kNN, ou árvore de decisão, usando papel e lápis e obter os mesmos resultados que os calculados no computador, no primeiro caso, será um aprendizado de máquina e, em segundo, não ..? Por outro lado, se você usa um computador para atribuir aleatoriamente alguns valores como "parâmetros" do seu modelo, qualificá-lo-á como um aprendizado de máquina, uma vez que foi feito por uma máquina? Esta definição não parece ter muito sentido ...
Tim
Você dificilmente pode chamá-lo de aprendizado de máquina se não usar uma máquina. É a máquina que aprende, afinal. Na verdade, implantei modelos que "aprenderam" seus parâmetros por um processo aleatório (Monte Carlo). No entanto, devo admitir que houve uma etapa de validação envolvida posteriormente.
Ytsen de Boer 5/11
2
Algoritmos como o Support Vector Machines são chamados de "máquinas" por motivos históricos, porque, nos primeiros dias, as pessoas precisavam criar máquinas / computadores reais para executá-los ( stats.stackexchange.com/questions/261041/… ), não tem nada a ver. faça com "algoritmos que são executados em máquinas". Além disso, modelos de séries temporais como o ARIMA não estão no escopo de aprendizado de máquina, mas em estatísticas e são executados em computadores.
Tim