Ciência de dados

8
Tutorial de aprendizado de máquina on-line

Alguém conhece alguns bons tutoriais sobre técnicas de aprendizado de máquina on-line? Ou seja, como ele pode ser usado em ambientes em tempo real, quais são as principais diferenças em comparação aos métodos normais de aprendizado de máquina, etc. UPD: Obrigado a todos pelas respostas. Por...

8
Similaridade da string da matriz de pontuação

Eu tenho uma carga de documentos, que possuem uma carga de pares de valores-chave. A chave pode não ser exclusiva, portanto, pode haver várias chaves do mesmo tipo com valores diferentes. Quero comparar a semelhança das chaves entre dois documentos. Mais especificamente, a semelhança de string...

8
Por que a regressão de aumento de gradiente prevê valores negativos quando não há valores y negativos no meu conjunto de treinamento?

Como eu aumentar o número de árvores em scikit aprender 's GradientBoostingRegressor, eu recebo previsões mais negativas, mesmo que não existem valores negativos em meu treinamento ou testar set. Eu tenho cerca de 10 recursos, a maioria dos quais são binários. Alguns dos parâmetros que eu estava...

8
Semelhança no cargo

Estou tentando definir uma métrica entre os cargos no campo de TI. Para isso, preciso de alguma métrica entre as palavras dos cargos que não aparecem juntas no mesmo cargo, por exemplo, métrica entre as palavras sênior, primário, líder, chefe, vice-presidente, diretor, coisas, diretor, chefe,...

8
Erro R usando o pacote tm (mineração de texto)

Estou tentando usar o pacote tm para converter um vetor de seqüências de texto em um elemento corpus. Meu código se parece com isso Corpus(d1$Yes) onde d1$Yesé um fator com 124 níveis, cada um contendo uma sequência de texto. Por exemplo, d1$Yes[246] = "So we can get the boat out!" Estou...

8
Como construir um mecanismo de pesquisa textual?

Estou tendo uma string HTML e quero descobrir se uma palavra fornecida é relevante nessa string. A relevância pode ser medida com base na frequência do texto. Um exemplo para ilustrar meu problema: this is an awesome bike store bikes can be purchased online. the bikes we own rock. check out our...

8
Agrupamento de união em gráficos bipartidos?

Estou tentando descobrir uma solução boa (e rápida) para o seguinte problema: Eu tenho dois modelos com os quais estou trabalhando, vamos chamá-los de jogadores e equipes. Um jogador pode estar em várias equipes e uma equipe pode ter vários jogadores). Estou trabalhando na criação de um elemento...

8
Gráfico interativo ao registrar dados

Estou olhando para o gráfico e explorar interativamente dados medidos ao vivo / continuamente. Existem algumas opções por aí, sendo plot.ly a mais fácil de usar. O Plot.ly possui uma interface do usuário fantástica e fácil de usar (facilmente escalável, configurável, facilmente ajustável / cabível...