nos meus negócios, lidamos com todas as análises através do Excel. Isso inclui principalmente programação, planejamento de produção e operações contábeis. Atualmente, estamos pensando em adicionar um pouco de modelagem preditiva e o Excel é suficiente até certo ponto, mas não tem suporte para modelos complexos.
A meu ver, os principais benefícios do Excel são a facilidade de uso e a facilidade com que você pode encontrar e treinar pessoas para se acostumarem. Por outro lado, ambientes mais sofisticados (por exemplo, R, python) podem lidar com uma variedade maior de tarefas de análise, mas exigem indivíduos mais bem treinados.
Também li essa pergunta sobre se o Excel é suficiente para a Ciência de Dados e, embora esteja um pouco fora do escopo para meu objetivo, a conclusão é que ferramentas como R e Python são muito melhores que o Excel.
Minha pergunta é (no contexto da análise de dados): "Até onde podemos chegar com o Excel, sem precisar mudar para uma ferramenta mais sofisticada?" ou "Em que momento precisamos migrar do Excel para o digamos R?"
Muito obrigado!
fonte
Respostas:
TL; DR
Se você tiver tempo ilimitado e usar uma versão de 64 bits do Excel, poderá chegar ao Excel tão longe quanto qualquer outra ferramenta de análise de dados.
Tempo
Menciono o tempo como meu primeiro fator, porque o Excel possui apenas funcionalidade básica incorporada, como soma, geração aleatória de números, pesquisas etc. Isso corresponde a um tipo de biblioteca padrão , que Python e R também possuem. Usando essas funções básicas, com tempo suficiente, você pode criar praticamente qualquer ferramenta de análise existente. Não espere um bom desempenho em tempo de execução. No Python e no R, no entanto, existem muitos pacotes que as pessoas já criaram, que apresentam bom desempenho e foram testados por muitas pessoas e, portanto, são confiáveis.
Memória
Meu segundo ponto sobre o Excel de 64 bits é porque isso permite que muito mais memória seja usada por uma única instância do Excel. Permite que muito mais células sejam preenchidas. O uso do Excel de 32 bits o limitará a projetos de cerca de 2 GB. Essa é uma quantidade razoável de dados, mas é um limite rígido.
Em seguida, as etapas no Excel de 64 bits, o que basicamente significa que não há mais limites de memória - apenas os que vêm do seu hardware, e isso significa que o Python e o R também serão interrompidos.
Para fornecer alguns números, podemos simplesmente calcular o número de bits que podem ser armazenados em cada versão. Aqui no prompt interativo do Python:
Eb
significa exa-bytes . Isso significa 18,4 milhões de milhões de gigabytes.Percebo que o cálculo mostra 4Gb para 32 bits, enquanto eu disse 2 Gb acima. Eu li que há um tipo de limite rígido na versão de 32 bits. Eu não sei ou me importo por que isso é ... eu uso Python e R ;-)
De qualquer forma, espero que isso seja suficiente para convencê-lo de que a memória não é um problema, se você é uma pessoa corajosa, disposta a investir todo o seu tempo construindo ferramentas desde o início!
Sumário
Se você tiver uma lógica de negócios complicada, onde a análise real é matematicamente simples, siga o Excel. Pessoas de negócios vão amar você por isso.
Se você quiser fazer mais do que regressão linear, use Python ou R.
Ressalvas
Até onde eu sei, você não pode executar tarefas remotas ou distribuídas usando o Excel, enquanto isso é relativamente fácil usando Python e (um pouco menos na minha opinião) R. Portanto, naquele momento, eu desistiria do Excel. Você provavelmente teria que implementar suas próprias ferramentas em C # ou C ++ usando a estrutura .Net.
fonte