Álgebra computacional simbólica para estatísticas

8

Que funcionalidade deve existir em um CAS especificamente voltado para o Statistics?

Sistemas de álgebra simbólica como Mathematica e Maple são freqüentemente usados ​​para problemas de cálculo, lógica e física, mas raramente são usados ​​para estatísticas. Por que é isso?

Que construções estatísticas podem ser adicionadas a um sistema de álgebra simbólica para melhorar seu uso neste campo? Quais são alguns exemplos de código específicos que muitas pessoas gostariam de fazer.

Pense nos três usuários a seguir: estatístico de pesquisa, pesquisador não estatístico que usa estatística em outro campo (como biologia), estudante de estatística.

Estarei trabalhando no código de estatísticas do SymPy nos próximos meses e gostaria de solicitar a entrada para a funcionalidade desejada. As coisas que eu uso não são necessariamente o que a comunidade mais ampla usa.

MRocklin
fonte
Há um pacote dedicado à estatística, consulte Projeto R para computação estatística ( r-project.org ).
Roman Luštrik 5/05
1
Sim, R é ótimo para estatísticas. Porém, ele tende a se especializar principalmente em cálculos numéricos. Estou interessado no que podemos fazer para ajudar os pesquisadores em manipulações simbólicas.
MRocklin 5/05
2
Não é evidente que qualquer um desses sistemas simbólicos precise de "construções estatísticas" adicionadas a eles. O Mathematica fez muito disso na versão 8, mas ainda não é provável que se torne uma plataforma popular para estatísticas aplicadas ou estudantes. Uma razão é que um bom software de estatística suporta muito melhor o trabalho não matemático do que o software matemático: entrada, gerenciamento, transformação, consulta e documentação de dados. O software de estatísticas geralmente também suporta uma enorme galeria de métodos de visualização de dados.
whuber
2
Não sei por que você acha que o CAS raramente é usado nas estatísticas; pessoalmente eu uso o Mathematica o tempo todo. Casella & Berger ainda tem um apêndice dedicado ao Mathematica. Mas, como estatístico, geralmente passo mais tempo com dados do que com matemática, como o @whuber aponta.
JMS
2
Reconheça também que muitos (a maioria?) Pesquisadores e estudantes acadêmicos têm acesso gratuito a pacotes maduros como Maple e Mathematica por meio de máquinas uni e / ou licenças de site.
JMS

Respostas:

9

Suporte para álgebra matricial. A grande maioria das estatísticas praticadas é multivariada e envolve matrizes, e muitas vezes a simplificação de formulários matriciais exige regras especiais que não são facilmente traduzidas de um caso univariado, portanto, um bom suporte matricial seria realmente útil.

user2839
fonte
2
Isso é algo em que o Mathematica já é bom.
whuber
Ponto excelente. O que poderia ser adicionado a um sistema que já expressava bem a álgebra linear? Ou uma expressão sólida de matrizes é suficiente?
MRocklin
1
@ MR Em vez de perguntar o que poderia ser adicionado a esses sistemas, pense por que você está fazendo isso. Para quem? Quais usos você deseja apoiar? Quais são os motivos convincentes (se houver) para adicionar procedimentos estatísticos a um sistema simbólico? Em outras palavras, comece com uma boa especificação funcional.
whuber