Eu fiz um curso de probabilidade na universidade há alguns anos atrás, mas estou passando por alguns algoritmos de aprendizado de máquina agora e parte da matemática é apenas desconcertante.
Especificamente agora, estou aprendendo o algoritmo EM (maximização de expectativa) e parece que há uma grande desconexão entre o que é necessário e o que tenho.
Não estou pedindo um livro ou site, mas qual é a maneira de aprender o suficiente sobre esses tópicos para obter uma compreensão completa dos algoritmos que os utilizam? É necessário ler um livro e fazer centenas de exercícios? Ou isso é um exagero nesse sentido?
edit: Se este é o local errado para esta pergunta, vote para migrar :)
Respostas:
Muitos dos livros e as apresentações on-line do aprendizado de máquina fornecem um pouco de introdução à probabilidade necessária em seu conteúdo, então eu começaria com um ou alguns livros desse tipo. De cabeça para baixo, posso pensar em Reconhecimento Estatístico de Padrões (pode ser porque eu aprendi EM aqui) e Os Elementos do Aprendizado Estatístico .
Meu verdadeiro conselho seria os tutoriais de mineração de dados estatísticos de Andrew Moore. Esse foi o site que preencheu a lacuna que eu tinha antes de iniciar meu doutorado (proveniente de uma formação em engenharia). Sei que você disse que não está perguntando sobre um site, mas veja o Probability for Data Miners lá e os outros slides de Probabilidade antes de decidir. E dê uma olhada no Gaussian Mixture Models for EM.
Acho que não. Os cálculos de probabilidade no aprendizado de máquina tendem a se agrupar em torno de alguns caminhos conhecidos. Ter uma forte compreensão da distribuição gaussiana única e multidimensional e estudar algumas explicações sobre EM deve levá-lo longe. E álgebra linear. Você precisará de muita álgebra linear.
fonte
A inteligência artificial ganhou importância na última década, dependendo muito do desenvolvimento e integração da IA em nossas vidas diárias. O progresso que a IA já alcançou é espantoso com carros autônomos, diagnóstico médico e até apostas humanas em jogos de estratégia como Go e Chess.
O futuro da IA é extremamente promissor e não está longe de ter nossos próprios companheiros robóticos. Isso levou muitos desenvolvedores a começar a escrever códigos e a desenvolver programas de IA e ML. No entanto, aprender a escrever algoritmos para AI e ML não é fácil e requer extensa programação e conhecimento matemático.
A matemática desempenha um papel importante, pois cria as bases para a programação desses dois fluxos.
Há muitas razões pelas quais a matemática é importante para o aprendizado de máquina. Alguns deles estão abaixo:
Selecionando o algoritmo correto, que inclui considerações sobre precisão, tempo de treinamento, complexidade do modelo, número de parâmetros e número de recursos. Escolha de configurações de parâmetros e estratégias de validação. Identificando underfitting e overfitting, compreendendo a compensação de desvio e desvio. Estimando o intervalo de confiança e a incerteza corretos.
Que tipo de matemática é necessária para o aprendizado de máquina?
A matemática é absolutamente necessária para o estudo de aprendizado de máquina ou inteligência artificial. Qualquer compreensão mais profunda dos conceitos e algoritmos no ML requer algum conhecimento básico de matemática.
Três principais teorias matemáticas: Álgebra Linear, Cálculo Multivariado e Teoria da Probabilidade.
Álgebra Linear -
A notação de álgebra linear é usada no Machine Learning para descrever os parâmetros e a estrutura de diferentes algoritmos de aprendizado de máquina. Isso faz da álgebra linear uma necessidade para entender como as redes neurais são montadas e como estão operando.
Abrange tópicos como:
Escalares, Vetores, Matrizes, Tensores Normas da Matriz Matrizes e Vetores Especiais Autovalores e Autovetores Cálculo Multivariado -
Isso é usado para complementar a parte de aprendizado do aprendizado de máquina. É o que é usado para aprender com exemplos, atualizar os parâmetros de diferentes modelos e melhorar o desempenho.
Abrange tópicos como:
Derivativos Integrais Gradientes Operadores Diferenciais Otimização Convexa Teoria das Probabilidades -
As teorias são usadas para fazer suposições sobre os dados subjacentes quando estamos projetando esses algoritmos de aprendizado profundo ou IA. É importante entendermos as principais distribuições de probabilidade,
Abrange tópicos como:
Elementos de probabilidade Variáveis aleatórias Distribuições Variação e expectativa Variáveis aleatórias especiais Como aprender matemática para aprendizado de máquina rapidamente?
A maneira iniciante de aprender matemática para a ciência de dados é aprender "fazendo merda". Mesmo assim, você desejará aprender ou revisar a teoria subjacente no início. Você não precisa ler um livro inteiro, mas desejará aprender primeiro os principais conceitos.
Como pré-requisitos simples, assumo a comodidade básica com o cálculo linear de álgebra / matriz (para que você não fique preso à notação) e à probabilidade introdutória.
Se você quiser aprender matemática para aprendizado de máquina profundamente, não há um número de cursos disponíveis on-line, como,
Álgebra Linear, Probabilidade e Estatística da Khan Academy, Cálculo Multivariável e Otimização.
Fundação matemática para aprendizado de máquina e IA no eduonix
Aprenda matemática do aprendizado de máquina por trás no udemy
Codificando a Matriz: Álgebra Linear através de Aplicações de Ciência da Computação por Philip Klein, Brown University.
Livro de Larry Wasserman - Todas as estatísticas: Um Curso Conciso em Inferência Estatística.
Lembre-se de que você aprende o melhor fazendo e, infelizmente, esses cursos não contêm tarefas e tarefas de casa suficientes
O que eu recomendo é: Fundação Matemática para Aprendizado de Máquina e IA - Este curso não é um currículo completo de matemática; não foi projetado para substituir o ensino de matemática da escola ou faculdade. Em vez disso, ele se concentra nos principais conceitos matemáticos que você encontrará nos estudos de aprendizado de máquina.
O que você aprenderá:
E muito mais……
No final deste curso, você não terá não apenas o conhecimento para criar seus próprios algoritmos, mas também a confiança para realmente começar a colocar seus algoritmos em uso em seus próximos projetos.
O curso também vem com projetos e testes para ajudar a solidificar seu conhecimento dos conceitos matemáticos.
Ele foi desenvolvido para preencher as lacunas dos alunos que perderam esses conceitos-chave como parte de sua educação formal ou que precisam refrescar suas memórias após um longo intervalo de tempo no estudo de matemática.
Penso que este curso é muito melhor do que investir 2 a 3 meses percorrendo o material no início e depois esquecendo metade do que você aprendeu quando o encontrou.
Tente entender os conceitos básicos mostrados e lembre-se sempre de se divertir!
fonte