Gostaria de saber se vocês têm alguns bons tutoriais (rápidos e diretos) sobre modelos de tópicos e LDA, ensinando intuitivamente como definir alguns parâmetros, o que eles significam e, se possível, com alguns exemplos
Gostaria de saber se vocês têm alguns bons tutoriais (rápidos e diretos) sobre modelos de tópicos e LDA, ensinando intuitivamente como definir alguns parâmetros, o que eles significam e, se possível, com alguns exemplos
Estou tentando ver se existe um termo convencional para esse conceito para me ajudar na minha pesquisa e literatura. Quando um modelo de aprendizado de máquina faz com que uma ação seja executada no mundo real que afeta instâncias futuras, como é chamado? Estou pensando em algo como um sistema de...
Eu tenho 40000 linhas de dados de texto do domínio da saúde. Os dados possuem uma coluna para texto (2 a 5 frases) e uma coluna para sua categoria. Eu quero classificar isso em 300 categorias. Algumas categorias são independentes, enquanto outras são um pouco relacionadas. A distribuição de dados...
Estou tentando descobrir como usar o chunker em cascata do NLTK conforme o Capítulo 7 do livro do NLTK . Infelizmente, estou tendo alguns problemas ao executar medidas de fragmentação não triviais. Vamos começar com esta frase: "adventure movies between 2000 and 2015 featuring performances by...
Quão amplamente o Theano é usado na pesquisa de aprendizado profundo? O Theano é um bom começo para aprender a implementação de algoritmos de aprendizado de máquina? Aprender a implementação de algo como uma rede feed forward realmente ajudará? Os estudantes de pós-graduação implementam redes...
Quero saber como é feito um detector de e-mail de spam. Não estou tentando criar um produto comercial, será um exercício de aprendizado sério para mim. Portanto, estou procurando recursos, como projetos existentes, código fonte, artigos, documentos, etc., que eu possa seguir. Quero aprender com...
Eu tenho um conjunto de dados como este. Os dados foram coletados através de um questionário e eu vou fazer algumas análises exploratórias. windows <- c("yes", "no","yes","yes","no") sql <- c("no","yes","no","no","no") excel <- c("yes","yes","yes","no","yes") salary <-...
Eu tenho uma grande sequência de vetores de comprimento N. Preciso de algum algoritmo de aprendizado não supervisionado para dividir esses vetores em segmentos M. Por exemplo: O K-means não é adequado, porque coloca elementos semelhantes de locais diferentes em um único cluster. Atualizar: Os...
Estou trabalhando em um projeto que visa recuperar um grande conjunto de dados (ou seja, dados de tweets com alguns dias) do Twitter, usando a biblioteca twitteR na R., tem dificuldade em armazenar tweets porque minha máquina possui apenas 8 GB de memória . Ficou sem memória mesmo antes de eu...
Eu tenho um script python escrito com o Contexto Spark e quero executá-lo. Tentei integrar o IPython ao Spark, mas não consegui. Então, tentei definir o caminho do spark [pasta / bin de instalação] como uma variável de ambiente e chamei o comando spark-submit no prompt do cmd. Acredito que está...
Introdução Digamos que eu tenho um conjunto de dados de observação diferente de pessoas diferentes e quero agrupar pessoas para saber qual pessoa está mais próxima da outra. Eu também quero ter uma medida para saber quão próximos eles estão um do outro e conhecer a significância...
Sei que há uma pergunta semelhante no stats.SE, mas não encontrei uma que atenda ao meu pedido; antes de marcar a pergunta como duplicada, envie-me um ping no comentário. Eu administro uma rede neural baseada na neuralnetprevisão de séries temporais do índice SP500 e quero entender como posso...
Estou procurando recomendações sobre o melhor caminho a seguir para o meu atual problema de aprendizado de máquina O resumo do problema e o que eu fiz é o seguinte: Tenho mais de 900 tentativas de dados de EEG, em que cada tentativa dura 1 segundo. A verdade básica é conhecida para cada um e...
Estou trabalhando com o conjunto de dados MovieLens10M, prevendo as classificações dos usuários. Se eu quiser avaliar meu algoritmo de maneira justa, como devo dividir meu treinamento versus dados de teste? Por padrão, acredito que os dados são divididos em conjuntos de treinamentos v. Test, nos...
Como recém-chegado em campo, acho muitos dos artigos do NIPS 2014 fascinantes, mas é difícil para mim avaliar quais representam o progresso real em relação às abordagens atuais. Quais documentos você acha que são mais significativos e provavelmente terão um grande
O que o termo "Inteligência" significa originalmente em "Inteligência de Negócios" ? Significa como usado em " Inteligência Artificial " ou usado em " Agência de Inteligência " ? Em outras palavras, " Business Intelligence " significa: "Agindo de maneira inteligente e inteligente nos negócios" ou...
Tenho dados para a posição lateral de cada veículo ao longo do tempo e o número da faixa, como mostrado nessas três parcelas na imagem e nos dados de amostra abaixo. > a Frame.ID xcoord Lane 1 452 27.39400 3 2 453 27.38331 3 3 454 27.42999 3 4 455 27.46512 3 5 456 27.49066 3 A posição...
Suponha que eu tenho um conjunto de dados: Amount of money (100, 50, 150, 200, 35, 60 ,50, 20, 500). Eu pesquisei na web à procura de técnicas que podem ser usadas para encontrar uma possível outlier neste conjunto de dados, mas acabei confuso. Minha pergunta é : Quais algoritmos, técnicas ou...
Estou prestes a mergulhar em um longo projeto de pesquisa NN e queria um empurrão na direção do Pylearn2 ou TensorFlow? A partir de dezembro de 2015, a comunidade começou a se inclinar em uma direção ou outra? Este link me preocupou em ficar vinculado ao
Você pode explicar o que é precisão finita? Por que a precisão finita é um problema no aprendizado de