Ciência de dados

8
Tutoriais sobre modelos de tópicos e LDA

Gostaria de saber se vocês têm alguns bons tutoriais (rápidos e diretos) sobre modelos de tópicos e LDA, ensinando intuitivamente como definir alguns parâmetros, o que eles significam e, se possível, com alguns exemplos

8
Chunking complexo com NLTK

Estou tentando descobrir como usar o chunker em cascata do NLTK conforme o Capítulo 7 do livro do NLTK . Infelizmente, estou tendo alguns problemas ao executar medidas de fragmentação não triviais. Vamos começar com esta frase: "adventure movies between 2000 and 2015 featuring performances by...

8
visualizar um gráfico de caixa horizontal em R

Eu tenho um conjunto de dados como este. Os dados foram coletados através de um questionário e eu vou fazer algumas análises exploratórias. windows <- c("yes", "no","yes","yes","no") sql <- c("no","yes","no","no","no") excel <- c("yes","yes","yes","no","yes") salary <-...

8
sklearn - problema de sobreajuste

Estou procurando recomendações sobre o melhor caminho a seguir para o meu atual problema de aprendizado de máquina O resumo do problema e o que eu fiz é o seguinte: Tenho mais de 900 tentativas de dados de EEG, em que cada tentativa dura 1 segundo. A verdade básica é conhecida para cada um e...

8
Pylearn2 vs TensorFlow

Estou prestes a mergulhar em um longo projeto de pesquisa NN e queria um empurrão na direção do Pylearn2 ou TensorFlow? A partir de dezembro de 2015, a comunidade começou a se inclinar em uma direção ou outra? Este link me preocupou em ficar vinculado ao