Essa também é uma questão que se relaciona muito com o Python como bancada de estatística e o Excel como bancada de estatística . Eu sei que há uma enorme discussão sobre Ruby versus Python, mas este não é o ponto nesta questão. Eu pensei que Ruby ser mais rápido que Python e ter uma sintaxe muito natural poderia me beneficiar na compreensão de estatísticas e também poderia ser uma boa alternativa para R (que também é do meu interesse e foi citada na minha outra pergunta em R aqui) Por exemplo, em uma das palestras do Google Tech que eu já vi (citada na pergunta vinculada aqui, o instrutor reclama que R é lento ao criar um loop for). Com o Ruby, há também o Rails, então talvez haja a possibilidade de reunir os dois também (o Python tem Django, mas, novamente, não vou entrar nisso).
Então, a pergunta permanece a mesma, mas para o meu interesse, em Ruby:
O que você pode recomendar se eu quiser usar o Ruby como uma "bancada de estatísticas" para substituir R, SPSS, Python, Excel etc.?
O que eu ganharia e perderia, com base na sua experiência?
Observe que estou considerando esta questão com base na pergunta anterior sobre Python e Excel. Se você acredita que o uso de Ruby e Python (ou Excel) teria o mesmo impacto, diga-o e aponte para os argumentos de qualquer pergunta anterior, o objetivo desta pergunta não é replicar as perguntas anteriores para as mesmas respostas. No entanto, acredito que existem diferenças (como a velocidade do idioma e a sintaxe), mas também gostaria de saber especialmente as recomendações para Ruby ou, se houver, por exemplo, muito menos disponível do que dizer para Python ou Excel. Portanto, considere as respostas anteriores para essas perguntas muito semelhantes, mas para outro idioma / programa.
Edit: Apenas para destacar, uma vez que as respostas parecem estar indo para o outro lado, a resposta que eu estava procurando é uma resposta como a resposta escolhida na pergunta em Python à qual me vinculei. É não sobre a aprendizagem de estatísticas juntamente com Ruby. Fiz ponto à pergunta aprender estatísticas com R . Se for possível, ótimo, mas não estou esperando aprender estatísticas com Ruby ao mesmo tempo. Você pode assumir o histórico de estatísticas para esta pergunta.
Respostas:
Estou usando Ruby + R.
Você pode ler o artigo: RinRuby: Acessando o intérprete R no Pure Ruby
http://www.jstatsoft.org/v29/i04/paper
e este blog:
http://rubyforscientificresearch.blogspot.com
http://sciruby.com/
(o autor do sciruby também é usuário R.)
fonte
RESPOSTA ANTIGA (PRÉ-EDIÇÃO):
Se você acha que aprenderá estatística programando tudo sozinho, eu diria que você está envolvido em uma longa jornada cheia de depuração e não aprendizado estatístico. Além disso, você precisará de um idioma como R para verificar suas respostas de qualquer maneira.
Acho que o user765195 tem razão em termos de R ser mais difícil de depurar do que em muitos outros idiomas, o que é importante, mas "pior"? Acho que não.
EDITAR:
Portanto, se eu puder resumir sua EDIT: considerando que você já faz estatísticas e que realmente deseja usar Ruby para fazê-lo em vez de um programa estatístico real (R, Gretl, SAS, etc), como você pode facilitar sua vida . Isso está certo?
Não posso responder Ruby, mas acho que a questão geral também deve ser abordada. Especialmente porque você está apontando para outras instanciações da mesma pergunta: "Gostaria de usar o Python / perl / java / Clojure / C / o que quer que seja para fazer estatísticas".
Penso que a resposta será sempre: "por que usar uma ferramenta generalizada e primitiva (em termos estatísticos) para fazer um trabalho que uma ferramenta especializada faz muito melhor?" E eu posso ver seis respostas básicas:
Simplesmente não quero aprender outro idioma e, como sou versado em Python / Ruby / Excel / Java, insisto em usá-lo.
As estatísticas que eu quero fazer precisam se encaixar em um projeto maior (como uma ferramenta baseada na Web) e as ferramentas usadas por esse projeto não funcionam bem com ferramentas externas, por isso tenho que usar Python / Ruby / Java. (Ou pode ser uma questão de implantar um aplicativo e não é possível tentar implantar executáveis arbitrários.)
Eu usaria uma ferramenta especializada, mas as que tenho acesso (por exemplo, R, que é gratuito) são muito lentas ou não conseguem lidar com os enormes conjuntos de dados / requisitos em tempo real do meu projeto.
Meu empregador / cliente insiste em usar a linguagem de uso geral Python / Ruby / Excel / Java. Não tenho escolha e estou procurando a maneira menos dolorosa de seguir esse requisito.
Por "estatísticas", quero dizer coisas muito simples, como encontrar meios / medianas, variações, etc. Por que usar um pacote especializado que pode calcular modelos de efeitos mistos via MCMC quando tudo que eu quero fazer é calcular quais pontos estão fora do 1-sigma longe da média?
Estou fazendo algo muito especializado e para o qual até pacotes estatísticos como R não possuem pacotes / bibliotecas / funções. Não é apenas de ponta, mas requer um desempenho super-alto, e eu preciso fazê-lo do zero. (Ou talvez use bibliotecas que já desenvolvi na linguagem X.)
Na minha opinião, a resposta 1 não é boa, a resposta 2 pode ser legítima, mas pode ter soluções alternativas que você não conhece, a resposta 3 é mais provável que seja legítima, mas também pode ter soluções alternativas, e para as outras três respostas , espero que você obtenha uma resposta melhor que a minha.
fonte
Alguns pensamentos aleatórios:
fonte