Faça o Keras rodar em um sistema de CPU com vários núcleos e várias máquinas

Estou trabalhando no modelo Seq2Seq usando LSTM da Keras (usando o Theano background) e gostaria de paralelizar os processos, porque poucos MBs de dados precisam de várias horas para treinamento.

É claro que as GPUs são muito melhores em paralelismo do que as CPUs. No momento, só tenho CPUs para trabalhar. Eu poderia acessar 16 CPUs (2 threads por núcleo X 4 núcleos por soquete X 2 soquetes)

No documento de suporte de vários núcleos no Theano, consegui usar todos os quatro núcleos de um único soquete. Portanto, basicamente, a CPU tem 400% de uso com 4CPUs usadas e as 12 CPUs restantes permanecem sem uso. Como faço para usá-los também. O fluxo de tensão também pode ser usado em vez do segundo plano do Theano, se funcionar.

tensorflow keras theano parallel yazhi
fonte

Respostas:

Para definir o número de threads usados no Theano (e, portanto, o número de núcleos da CPU), você precisará definir alguns parâmetros no ambiente:

import os
os.environ['MKL_NUM_THREADS'] = '16'
os.environ['GOTO_NUM_THREADS'] = '16'
os.environ['OMP_NUM_THREADS'] = '16'
os.eviron['openmp'] = 'True'

Isso deve permitir que você use todos os núcleos de todas as CPUs.

Obviamente, isso também pode ser feito no Tensorflow:

import tensorflow as tf
from keras.backend import tensorflow_backend as K

with tf.Session(config=tf.ConfigProto(
                    intra_op_parallelism_threads=16)) as sess:
    K.set_session(sess)
    <Your Keras code>

Thomas Cleberg
fonte

Eu ficaria grato por este código por definir o número de núcleos em R (estou usando keras em R e está usando apenas parte dos núcleos ...). Especialmente para fluxo tensor. Obrigado, Milão

gutompf

Você pode usar Sys.setenv () para definir variáveis de ambiente em R, semelhante ao uso de os.environ [var] no Python.

Thomas Cleberg 22/01