Definição de um modelo em aprendizado de máquina

11

Essa definição não se aplica muito, pois nem sempre estamos assumindo uma distribuição subjacente. Então, o que é realmente um modelo? Um GBM com hiperparâmetros especificados pode ser considerado um modelo? Um modelo é uma coleção de regras?

agave orgânico
fonte
1
Você pode dar um passo adiante à genérica e olhar para en.wikipedia.org/wiki/Mathematical_model - a maioria dos modelos de ML corresponde à definição, mesmo que não corresponda ao "modelo estatístico" (embora eu ache que quase todos os treinados não sejam supervisionados ou modelos supervisionados de ML seriam considerados modelos estatísticos).
Neil Slater

Respostas:

7

Eu estava interessado na mesma pergunta recentemente e cheguei à conclusão de que não há uma definição única de um "modelo" no aprendizado de máquina. É altamente dependente das fontes que você está consultando, que podem ser a documentação para um programa de software específico, a gíria adotada por sua comunidade de usuários ou as definições usadas nos trabalhos acadêmicos publicados, que podem variar amplamente de periódico para periódico. Além disso, tive que aprender a ter em mente que esses documentos são escritos não apenas por especialistas em aprendizado de máquina, mas por especialistas em outras disciplinas que precisam aplicar técnicas de aprendizado de máquina (como imagens, diversas áreas médicas, etc.) . Muitos deles não definem explicitamente o termo "modelo", que é frequentemente usado livremente. Aqui estão apenas algumas definições diferentes de "modelo" I '

• Modelos estatísticos, particularmente os relacionados às distribuições de probabilidade.

• Dados de regressão e estatísticas relacionadas.

• Modelos matemáticos, como mencionado acima por Neil Slater.

• Os modelos de dados usados ​​no aprendizado de máquina, como as colunas envolvidas, seus tipos de dados, as fontes de dados e outros metadados. Isso é particularmente complicado porque não há nada matemático nessa definição, ao contrário dos três primeiros que listei. Por exemplo, consulte toda a documentação dos "modelos de mineração" do SQL Server, que cumprem deveres duplos para fins de aprendizado de máquina.

• Às vezes, todas as definições acima são expandidas para incluir estruturas de aprendizado de máquina construídas sobre as equações e os metadados, como as especificações das redes neurais. Em outros casos, essas são consideradas entidades separadas.

Às vezes, todos os itens acima são misturados e combinados, dependendo da fonte. Tenho certeza de que existem outras definições de "modelo" que deixei de fora desta lista, o que complicará ainda mais o assunto. Para lidar com essa ambiguidade, estou tentando me treinar a adivinhar as intenções do autor sempre que ele usar o termo "modelo". Às vezes, é fácil determinar com base no contexto ou no campo em que o autor trabalha, mas outras vezes eu tenho que ler profundamente um artigo ou documentação antes de descobrir. Eu gostaria de poder ser mais definitivo sobre isso, mas é realmente um termo naturalmente confuso; nunca haverá uma resposta simples para isso. Espero que ajude.

SQLServerSteve
fonte
1
Embora o termo "modelo" possa realmente se aplicar a muitas coisas, no contexto do Machine Learning, o modelo é o artefato criado através do aprendizado / treinamento - por exemplo, no caso de redes neurais, os pesos e preconceitos dessa rede.
Syzygy
5

Gosto da definição de Machine Learning dada por Tom Mitchell .

Diz-se que um programa de computador aprende com a experiência E em relação a alguma classe de tarefas T e medida de desempenho P, se seu desempenho nas tarefas em T, medido por P, melhorar com a experiência E.

Portanto, dada essa definição, devo dizer que um modelo é a experiência adquirida depois de fazer alguma aula T.

omar
fonte
A experiência E não é o conjunto de treinamento?
Itamar Mushkin
4

Do artigo no Amazon Machine Learning

O processo de treinamento de um modelo de ML envolve fornecer um algoritmo de ML (ou seja, o algoritmo de aprendizado) com dados de treinamento para aprender. The term ML model refers to the model artifact that is created by the training process.

Vlad Bezden
fonte
2

Um modelo, em termos gerais, é uma simplificação de alguma coisa ou processo. Por exemplo, a forma da Terra não é realmente uma esfera, mas podemos tratá-la como uma, se estivermos projetando um globo. Da mesma forma, supondo que o universo seja determinístico, existe algum processo natural que determina se um cliente comprará um produto em um site. Podemos construir algo que se aproxime desse processo, que possamos fornecer algumas informações sobre um cliente e que nos diga se acha que o cliente comprará um produto.

Um "modelo de aprendizado de máquina", então, é um modelo construído por um sistema de aprendizado de máquina.

(Desculpas por não ser uma resposta rigorosa, mas espero que ainda seja útil.)

Ceasar Bautista
fonte
1

No paradigma de aprendizado de máquina, modelo refere-se a uma expressão matemática de parâmetros do modelo, juntamente com marcadores de entrada para cada previsão, classe e ação para categorias de regressão, classificação e reforço, respectivamente.

Essa expressão está embutida no neurônio único como modelo.

Para o perceptron de camada única e o modelo de aprendizado profundo, é necessário extrair esse modelo caminhando cuidadosamente os neurônios e as camadas para coletar e costurar a função de ativação de uma maneira ordenada.

cppRohit
fonte
0

No aprendizado de máquina, o modelo é o centro de gravidade e tudo gira em torno do modelo. Embora pessoas diferentes tenham definições diferentes do modelo. Mas, na minha opinião, aqui está a melhor maneira de definir o modelo "modelo em aprendizado de máquina é a hipótese que tenta ajustar os dados e aprender a prever os dados invisíveis".

Awais Bajwa
fonte