Estou treinando modelos de floresta aleatórios em R usando randomForest()
com 1000 árvores e quadros de dados com cerca de 20 preditores e linhas de 600 mil. No meu laptop, tudo funciona bem, mas quando passo para o amazon ec2, para executar a mesma coisa, recebo o erro:
Error: cannot allocate vector of size 5.4 Gb
Execution halted
Estou usando o c3.4xlarge
tipo de instância, por isso é bastante robusto. Alguém conhece uma solução alternativa para fazê-lo funcionar nesta instância? Gostaria de saber as nuances de memória que causam esse problema apenas na instância ec2 e não no meu laptop (processador OS X 10.9.5 de 2.7 GHz Intel Core i7; memória 16 GB 1600 MHz DDR3)
Obrigado.
fonte