Perguntas com a marcação «python»

Use para questões de ciência de dados relacionadas à linguagem de programação Python. Não se destina a perguntas gerais de codificação (-> stackoverflow).

101
Python vs R para aprendizado de máquina

Estou apenas começando a desenvolver um aplicativo de aprendizado de máquina para fins acadêmicos. Atualmente, estou usando R e me treinando nele. No entanto, em muitos lugares, vi pessoas usando Python . O que as pessoas estão usando na academia e na indústria e qual é a

73
Diferença entre isna () e isnull () em pandas

Eu tenho usado pandas por algum tempo. Mas não entendi qual é a diferença entre isna()e isnull()nos pandas. E, mais importante, qual usar para identificar valores ausentes no quadro de dados. Qual é a diferença básica subjacente de como um valor é detectado como um naou outro...

33
Multi GPU em keras

Como você pode programar na biblioteca keras (ou tensorflow) para particionar o treinamento em várias GPUs? Digamos que você esteja em uma instância do Amazon ec2 com 8 GPUs e que gostaria de usá-los para treinar mais rapidamente, mas seu código é apenas para uma única CPU ou...

33
Abrindo um arquivo de 20 GB para análise com pandas

No momento, estou tentando abrir um arquivo com pandas e python para fins de aprendizado de máquina. Seria ideal para todos eles em um DataFrame. Agora, o arquivo tem 18 GB de largura e minha RAM tem 32 GB, mas continuo recebendo erros de memória. De sua experiência é possível? Se você não conhece...

29
Por que o xgboost é muito mais rápido que o sklearn GradientBoostingClassifier?

Estou tentando treinar um modelo de aumento de gradiente com mais de 50 mil exemplos com 100 recursos numéricos. XGBClassifierlida com 500 árvores em 43 segundos na minha máquina, enquanto GradientBoostingClassifierlida com apenas 10 árvores (!) em 1 minuto e 2 segundos :( Não me preocupei em...

27
Parâmetros do XGBoost com ajuste otimizado

O XGBoost tem feito um ótimo trabalho quando se trata de lidar com variáveis ​​dependentes categóricas e contínuas. Mas, como seleciono os parâmetros otimizados para um problema no XGBoost? Foi assim que apliquei os parâmetros para um problema recente do Kaggle: param <- list( objective =...

26
PyTorch vs. Tensorflow Fold

Tanto o PyTorch quanto o Tensorflow Fold são estruturas de aprendizado profundo destinadas a lidar com situações em que os dados de entrada têm comprimento ou dimensões não uniformes (ou seja, situações em que gráficos dinâmicos são úteis ou necessários). Gostaria de saber como eles se comparam,...