Estou fazendo um curso de pós-graduação em Estatística Aplicada que usa o seguinte livro (para dar uma idéia do nível do material coberto): Conceitos e Métodos Estatísticos , de GK Bhattacharyya e RA Johnson.
O professor exige que usemos o SAS para os trabalhos de casa.
Minha pergunta é: existe uma (s) biblioteca (s) Java, que pode ser usada em vez do SAS para problemas normalmente vistos nessas classes.
Atualmente, estou tentando me contentar com o Apache Math Commons e, embora esteja impressionado com a biblioteca (é fácil de usar e compreensível), parece não ter coisas simples, como a capacidade de desenhar histogramas (pensando em combiná-lo com uma biblioteca de gráficos) )
Eu olhei para Colt, mas meu interesse inicial diminuiu rapidamente.
Gostaria de receber qualquer entrada - e eu olhei para perguntas semelhantes no Stackoverflow, mas não encontrei nada atraente.
NOTA: Conheço as bibliotecas R, SciPy e Octave e java que fazem chamadas para elas - estou procurando uma biblioteca nativa Java ou um conjunto de bibliotecas que possam fornecer os recursos que estou procurando.
NOTA: Os tópicos abordados nessa classe geralmente incluem: testes de uma amostra e duas amostras e intervalos de confiança para médias e medianas, estatística descritiva, testes de qualidade do ajuste, ANOVA de uma e duas vias, inferência simultânea, testes variações, análise de regressão e análise de dados categóricos.
Respostas:
Quando sou forçado a usar java para estatísticas básicas, o apache commons math é o caminho a percorrer. Para gráficos, eu uso e recomendo o JFreeChart . O último é amplamente difundido, portanto, o stackoverflow ainda possui uma tag preenchida .
Editar
Se alguém procura uma suíte, talvez o Dedutor seja uma opção. A GUI é baseada no JGR, enquanto as partes estatísticas são chamadas em R. Parece ser prorrogável via R e java . Pode-se, por exemplo, pular as chamadas para o Rengine, mas chamar as bibliotecas java referenciadas. Mas admito que ainda não tentei.
Até onde eu entendi o OP, o ideal seria algo como o Rapidminer for Statistics , já que o Rapidminer é uma estrutura java pura que suporta acesso à GUI (incluindo visualizações), uso como biblioteca e desenvolvimento de plugins personalizados. Que eu saiba, algo assim para as estatísticas não existe. Eu não recomendo RapidMiner para essa tarefa particular , porque ao melhor de meu conhecimento que só inclui a maioria dos testes estatísticos básicos. As visualizações foram estendidas ultimamente, mas não posso estimar quão personalizáveis elas são agora.
fonte
Confira Suan Shu: NumericalMethod.com . Não é gratuito em geral, mas é gratuito para uso acadêmico.
fonte
Semelhante à sugestão de RapidMiner de steffen, você pode considerar Weka . Pode ser voltado mais especificamente para o aprendizado de máquina do que você espera. Possui muitos algoritmos para tarefas como clustering, classificação e regressão. O Weka possui uma GUI, mas também pode ser usada como uma biblioteca de software. Vi histogramas na GUI, mas não tenho certeza se é fácil reutilizá-los através da biblioteca ou não.
fonte
Tente http://www.roguewave.com/Portals/0/products/imsl-numerical-libraries/java-library/docs/5.0.1/api/overview-summary.html
Está bem documentado e fornece muitas funções estatísticas e matemáticas úteis. Mas, infelizmente, não é de código aberto. Portanto, se isso não incomodá-lo, a biblioteca deve estar ok.
Eu não sei no entanto, se ele fornece saída gráfica.
fonte
O ambiente de computação DataMelt possui muitas bibliotecas estatísticas Java quase para qualquer tópico. Você pode usá-lo usando o Jython conforme recomendado no site, mas eu o uso com Java e Groovy.
Posso dizer mais: o projeto DataMelt abrange os seguintes tópicos estatísticos:
Aqui está um exemplo de regressão não linear usando a abordagem de probabilidade de log para ajustar dados com erros:
O pacote é gratuito.
fonte