Ciência de dados

11
Trabalhando com Clusters HPC

Na minha universidade, temos um cluster de computação HPC. Eu uso o cluster para treinar classificadores e assim por diante. Portanto, geralmente, para enviar um trabalho para o cluster (por exemplo, script python scikit-learn), preciso escrever um script Bash que contenha (entre outros) um comando...

11
Rede neural para monitoramento de servidor

Estou olhando o pybrain para receber alarmes do monitor do servidor e determinar a causa raiz de um problema. Fico feliz em treiná-lo usando aprendizado supervisionado e selecionando os conjuntos de dados de treinamento. Os dados estão estruturados mais ou menos assim: Servidor Tipo A # 1 Tipo...

11
Usando cluster no processamento de texto

Olá, esta é minha primeira pergunta na pilha de ciência de dados. Eu quero criar um algoritmo para classificação de texto. Suponha que eu tenha um grande conjunto de textos e artigos. Vamos dizer cerca de 5000 textos simples. Primeiro, uso uma função simples para determinar a frequência de todas as...

11
Como mesclar dados mensais, diários e semanais?

O Google Trends retorna dados semanais, portanto, preciso encontrar uma maneira de mesclá-los com meus dados diários / mensais. O que fiz até agora é dividir cada série em dados diários, por exemplo: a partir de: 2013-03-03 - 2013-03-09 37 para: 2013-03-03 37 2013-03-04 37 2013-03-05 37...

11
Intuição para o parâmetro de regularização no SVM

Como a variação do parâmetro de regularização em um SVM altera o limite de decisão para um conjunto de dados não separável? Uma resposta visual e / ou algum comentário sobre os comportamentos limitantes (para regularizações grandes e pequenas) seria muito

11
Raspagem na web do LinkedIn

Descobri recentemente um novo pacote R para conectar-se à API do LinkedIn. Infelizmente, a API do LinkedIn parece bastante limitada; por exemplo, você só pode obter dados básicos sobre empresas, e isso é desanexado dos dados de indivíduos. Gostaria de obter dados de todos os funcionários de uma...