Estou usando as Redes Neurais para resolver diferentes problemas de aprendizado de máquina. Estou usando Python e pybrain, mas esta biblioteca está quase descontinuada. Existem outras boas alternativas em
Use para questões de ciência de dados relacionadas à linguagem de programação Python. Não se destina a perguntas gerais de codificação (-> stackoverflow).
Estou usando as Redes Neurais para resolver diferentes problemas de aprendizado de máquina. Estou usando Python e pybrain, mas esta biblioteca está quase descontinuada. Existem outras boas alternativas em
Sou iniciante em ciência de dados e não entendo a diferença entre fite fit_transformmétodos no scikit-learn. Alguém pode simplesmente explicar por que precisamos transformar dados? O que significa ajustar modelo em dados de treinamento e transformar em dados de teste? Significa, por exemplo,...
Estou apenas começando a desenvolver um aplicativo de aprendizado de máquina para fins acadêmicos. Atualmente, estou usando R e me treinando nele. No entanto, em muitos lugares, vi pessoas usando Python . O que as pessoas estão usando na academia e na indústria e qual é a
Estou tentando executar o SVR usando o scikit learn (python) em um conjunto de dados de treinamento com 595605 linhas e 5 colunas (recursos) e o conjunto de dados de teste com 397070 linhas. Os dados foram pré-processados e regularizados. Consigo executar os exemplos de teste com êxito, mas ao...
Eu tenho usado pandas por algum tempo. Mas não entendi qual é a diferença entre isna()e isnull()nos pandas. E, mais importante, qual usar para identificar valores ausentes no quadro de dados. Qual é a diferença básica subjacente de como um valor é detectado como um naou outro...
Estou fazendo alguns problemas em uma aplicação de árvore de decisão / floresta aleatória. Estou tentando ajustar um problema que possui números e seqüências de caracteres (como o nome do país) como recursos. Agora, a biblioteca, o scikit-learn usa apenas números como parâmetros, mas quero injetar...
Histórico do problema: Estou trabalhando em um projeto que envolve arquivos de log semelhantes aos encontrados no espaço de monitoramento de TI (para minha melhor compreensão do espaço de TI). Esses arquivos de log são dados de séries temporais, organizados em centenas / milhares de linhas de...
Estou tentando começar a aprender sobre RNNs e estou usando o Keras. Entendo a premissa básica das camadas RNN e LSTM de baunilha, mas estou tendo problemas para entender um certo ponto técnico do treinamento. Na documentação do keras , diz que a entrada para uma camada RNN deve ter forma...
Qual é a abordagem correta e o algoritmo de clustering para clustering de geolocalização? Estou usando o seguinte código para agrupar coordenadas de localização geográfica: import numpy as np import matplotlib.pyplot as plt from scipy.cluster.vq import kmeans2, whiten coordinates= np.array([...
Estou trabalhando em um projeto de ciência de dados usando Python. O projeto tem várias etapas. Cada estágio consiste em pegar um conjunto de dados, usando scripts Python, dados auxiliares, configuração e parâmetros e criar outro conjunto de dados. Eu guardo o código no git, para que essa parte...
Estou usando o TensorFlow para experimentos principalmente com redes neurais. Embora eu tenha feito algumas experiências (XOR-Problem, MNIST, algumas coisas de Regressão, ...) agora, luto com a escolha da função de custo "correta" para problemas específicos, porque no geral eu poderia ser...
Eu obtive o ValueError ao prever dados de teste usando um modelo RandomForest. Meu código: clf = RandomForestClassifier(n_estimators=10, max_depth=6, n_jobs=1, verbose=2) clf.fit(X_fit, y_fit) df_test.fillna(df_test.mean()) X_test = df_test.values y_pred = clf.predict(X_test) O...
Eu tenho um quadro de dados do pandas com várias entradas e quero calcular a correlação entre a renda de algum tipo de loja. Existem várias lojas com dados de renda, classificação da área de atividade (teatro, lojas de roupas, alimentos ...) e outros dados. Tentei criar um novo quadro de dados e...
Como você pode programar na biblioteca keras (ou tensorflow) para particionar o treinamento em várias GPUs? Digamos que você esteja em uma instância do Amazon ec2 com 8 GPUs e que gostaria de usá-los para treinar mais rapidamente, mas seu código é apenas para uma única CPU ou...
No momento, estou tentando abrir um arquivo com pandas e python para fins de aprendizado de máquina. Seria ideal para todos eles em um DataFrame. Agora, o arquivo tem 18 GB de largura e minha RAM tem 32 GB, mas continuo recebendo erros de memória. De sua experiência é possível? Se você não conhece...
Eu estou trabalhando em pesquisa, onde necessidade de uma classificar de WINNER três event = ( win, draw, lose) WINNER LEAGUE HOME AWAY MATCH_HOME MATCH_DRAW MATCH_AWAY MATCH_U2_50 MATCH_O2_50 3 13 550 571 1.86 3.34 4.23 1.66 2.11 3 7 322 334 7.55 4.1 1.4 2.17 1.61 Meu modelo atual é: def...
Estou tentando treinar um modelo de aumento de gradiente com mais de 50 mil exemplos com 100 recursos numéricos. XGBClassifierlida com 500 árvores em 43 segundos na minha máquina, enquanto GradientBoostingClassifierlida com apenas 10 árvores (!) em 1 minuto e 2 segundos :( Não me preocupei em...
O XGBoost tem feito um ótimo trabalho quando se trata de lidar com variáveis dependentes categóricas e contínuas. Mas, como seleciono os parâmetros otimizados para um problema no XGBoost? Foi assim que apliquei os parâmetros para um problema recente do Kaggle: param <- list( objective =...
Estou usando uma regressão linear padrão usando o scikit-learn em python. No entanto, gostaria de forçar os pesos a serem positivos para todos os recursos (não negativos). Existe alguma maneira de conseguir isso? Eu estava procurando na documentação, mas não consegui encontrar uma maneira de fazer...
Tanto o PyTorch quanto o Tensorflow Fold são estruturas de aprendizado profundo destinadas a lidar com situações em que os dados de entrada têm comprimento ou dimensões não uniformes (ou seja, situações em que gráficos dinâmicos são úteis ou necessários). Gostaria de saber como eles se comparam,...