Qual software estatístico é adequado para o ensino de um curso introdutório de estatística em ciências sociais?

11

Estou procurando um pacote de software estatístico que possa ser usado em um curso introdutório de estatística para um programa de estudos em ciências sociais. Os alunos também não têm conhecimento prévio de estatística nem experiência com linguagens de programação. O objetivo é apresentá-los a conceitos estatísticos básicos (como média, variância, soma dos quadrados, valores de p ... e finalmente regressão linear) e permitir que eles realizem análises básicas por conta própria usando exemplos de conjuntos de dados. O curso deve ser sobre o aprendizado de conceitos, fazendo estatística, em vez de memorizar fórmulas (embora eu ache que fórmulas são importantes).

Portanto, estou procurando uma alternativa à sintaxe usual (como R normal) ou ao software apontar e clicar (como SPSS ou Rcmdr). O software deve ser facilmente aprendido e deve ter uma interface gráfica clara do usuário que visualize conjuntos de dados e ofereça gráficos e tabelas padrão. O melhor seria se visualizasse todas as etapas diferentes de uma análise (por exemplo, leitura e manipulação de dados, cálculo de medidas descritivas, elaboração de tabelas e gráficos descritivos, cálculo de medidas inferenciais, plotagem de gráficos inferenciais, plotagem de gráficos inferenciais, exportação para um relatório).

Você tem sugestões de software estatístico (de código aberto ou gratuito) adequado para aprender e praticar primeiro as estatísticas?

EDIT
Obrigado por suas sugestões. Eu examinei o Gretl e outros dois programas que encontrei durante minha própria consulta on-line: RapidMiner e Statistical Lab . [1]
Descobri que gretla interface e a saída são mais claras e focadas do que, por exemplo, Rcmdr, SPSS ou Stata. Portanto, é uma ferramenta bem qualificada para começar a ensinar estatística do meu ponto de vista.
No entanto, as GUIs do fluxograma RapidMinereStatistical Labme impressionou ao visualizar as etapas únicas de uma análise estatística (começando com o carregamento de dados). Eu acho que isso pode ser útil para muitos estudantes que lutam com o foco usual em explicações matemáticas. Obviamente, o RapidMiner me parece muito sobrecarregado com funções, menus e botões para iniciantes, enquanto o Laboratório de Estatística é muito mais focado. A grande vantagem do Statistical Lab é o "R-Calculator" do tipo console, com um "Assistente de código R", que ajuda a produzir a sintaxe R real, conforme o Laboratório de Estatística depende Rde seus cálculos.
Por fim, decidi começar pelo Laboratório de Estatística no primeiro semestre, enquanto apresentava os conceitos básicos e mudei para o RStudio (e Rcmdr) no segundo semestre.

[1]: Gnumeric, SciPy, Scilab, GNU Octave e similares me parecem menos direcionados para as ciências sociais.

argumento não numérico
fonte
8
@ Matthias: Eu acho que se seus alunos estão vindo / com o objetivo de / para um campo das ciências sociais, ensiná-los R como o primeiro passo em Estatística é um exagero. A maioria deles terá problemas com o conceito de console, comandos, sintaxe etc. e você passará mais tempo analisando "conceitos de programação" (o que é 'função', 'loop' etc.) do que "estatísticas". Baseei isso na experiência anterior, quando fiz tutoriais para uma Stats 101 em um departamento da Soc.Science; as pessoas perderam o objetivo das palestras porque se concentraram mais em fazer o R ​​trabalhar para elas do que realmente explorar seus dados.
precisa saber é o seguinte
1
@ user11852: Você pode estar certo, mas é triste que as escolas secundárias enviem estudantes sem nenhuma exposição de programação. Ou universidades que permitem essa lacuna. Não deveria haver nenhum aluno que freqüenta uma turma universitária que não sabe o que é um loop ou função. Atrasar a exposição apenas coloca o problema em outro lugar.
11383 curious_cat
2
@ user11852: A outra opção menos palatável pode ser que os departamentos de Satistics insistam que as classes "Stats 101 for Social Sciences" têm um pré-requisito de alguma experiência em programação ou uma classe de correção em programação. Hoje em dia, quando quase todos os assuntos são tão fortemente influenciados pela computação, não há realmente nenhuma razão para que a Programação-101 não deva ser a primeira aula de todos.
11383 curious_cat
6
Pelo que vale, usei R com sucesso em meu curso introdutório de estatísticas para a ciência política. Eu usei o RStudio . Eu também tinha "laboratórios" semanais, onde permitia que os alunos trabalhassem juntos em pequenas tarefas, enquanto andava e respondia perguntas. Com algum código de exemplo bem comentado, os alunos se saíram bem e quase não reclamaram. Na verdade, eles se queixaram muito menos do R do que no semestre anterior, quando eu usei o Stata. Como o Stata não é gratuito, os alunos tiveram que passar horas de laboratório para fazer seu trabalho - eles odiavam.
Jason Morgan
6
Eu acho que R em conjunto com o RStudio pode ser uma excelente abordagem. Ele também prepara o terreno para a prática de pesquisa reproduzível, diferentemente dos sistemas de menus. Eu recomendaria fornecer vários modelos de código que os alunos possam carregar no RStudio pela Web (o RStudio facilita isso) e permitir que eles façam o trabalho de alterar nomes de variáveis ​​e modelos estatísticos para o que é necessário para o problema em questão.
Frank # # # Harrell Harrell

Respostas:

12

Talvez Gretl? http://gretl.sourceforge.net/

É gratuito e usado em nossa Universidade para estatísticas de graduação.

Stat Tistician
fonte
9
+1. Excelente sugestão. Eu sempre achei a GUI de Gretl intuitiva e direta ao ponto e o feedback que ela fornece precisa e sem frescuras demais que adiariam alguns alunos menos "tecnológicos". Além disso, é gratuito, bem documentado e possui um console R, se alguém se inclina a ver algo um pouco "mais profundo".
precisa saber é o seguinte
8

Eu evitaria a maioria das coisas "famosas", MatLab , Maple , Mathematica , JMP , SAS ou Minitab , porque quando seus alunos se formam, eles têm que pagar milhares de dólares por ano para usá-los profissionalmente. Cada empresa tende a ter sua ferramenta favorita em particular, e se você lhes ensinar uma ferramenta pela qual a empresa não pagará, seu conjunto de habilidades será desperdiçado. Também não gosto das bibliotecas proprietárias - eles treinam os usuários a pressionar botões e, se o usuário quiser ir para outro lugar (JMP ou o que seja), não haverá transferência de aprendizado.

Python, incluindo SciPy / NumPy, é muito bom. É de código aberto e bem suportado. Possui uma gramática fácil de aprender. Ele ainda é interpretado para não gritar rápido, mas se eles não conhecem nenhum script ou planilha, é muito mais rápido do que precisariam. PythonXY é uma boa versão, possui boas bibliotecas e suporte. Também gosto que a programação da GUI seja possível através dele. Criar aplicativos independentes no Windows é um pouco desafiador, mas provavelmente acima do nível de seus alunos. (editar) Sábio e Cythonmelhorar substancialmente a proposição de valor do Python. A interface e a usabilidade são substancialmente aprimoradas. Um código compilado que é 1000x mais rápido que um bom código interpretado parece ótimo (ou surpreendente) para mim. Edição: Eu me diverti um pouco usando as distribuições Anaconda (aka conda), e elas também são muito simples de usar.

Eu não sou um grande fã de Perl . Está um pouco desatualizado. Trata-se de analisar e processar texto mais do que matemática / ciências. Não me interpretem mal, ele pode fazer matemática / ciências, mas se você conhece o VBA, o MSWord pode fazer matemática / ciências. Ser capaz não é o mesmo, ter um trabalho específico como seu foco principal.

Eu gosto de R , mesmo que você não goste , porque está sendo desenvolvido agressivamente por PhDs qualificados em matemática / estatística. Isso significa que, embora a gramática possa ser klugy, ela terá bibliotecas atualizadas e comprovadamente livres de erros. (Em geral)

Excel não é um começo ruim. Depois de conhecer uma planilha, ela facilita o uso de qualquer outra. Em um ambiente de negócios, quase todas as empresas têm o escritório da MicroSloth , portanto o Excel não é uma má idéia. Não gosto do script deles, mas isso é apenas preferência, ainda posso usá-lo. Custa cerca de 150 dólares americanos em comparação com 5000 dólares americanos para alguns dos outros softwares, portanto o custo inicial para pessoas normais é mais razoável.

A linguagem de script do JMP é estranha. Não é traduzido para outro software (não SA). Fique longe disso. O único recurso resgatável do idioma é que ele pode (em um sentido limitado) executar o código "R". Se você estiver codificando em "R", use "R" e "RStudio".

Eu não usei o MathCAD, por isso não posso falar sobre sua relevância. Eu acho que é mais simbólico, menos sobre a importação de dados externos. É mais barato, até agora. Não é gratuito e aberto. A instalação não se traduz em instalação em outro idioma. ( EDIT ) Também nesta categoria está o EES , que também não me impressiona fora de uma janela de uso muito estreita.

EDIT : Fiquei um pouco impressionado com o LabVIEW . É simples o suficiente para usar que algumas horas podem permitir que alguém seja capaz. Ele roda muito rápido, como literalmente 1000x mais rápido que o MatLab para literalmente exatamente o mesmo código ( MathScript ). Se você tem algum trabalho pesado, vale a pena considerar um pouco. Custa dinheiro, mas algo em torno de 1/5 do ferro convencional.

Boa sorte

EDIT: Eu não usaria o Statistical LAboratory porque, mesmo quando você seleciona "english" para o idioma, ele sai em alemão e não é desinstalado no Windows 7. Ambas as fraquezas administrativas o tornam um impedimento para mim. Não consigo operá-lo e quando tentei removê-lo, falhei.

Por tentativa e erro, descobri a configuração do menu para exibi-la em inglês. Parece ser uma interface relativamente simples (e, portanto, útil e consistente) em algumas bibliotecas R para processamento e exibição de dados. Vou ter que analisar mais a fundo, então, neste ponto, 'o júri ainda está fora.'

EDITAR mais:

-> Aqui <- é um link divertido para toda uma outra discussão sobre ferramentas e bancadas de trabalho.

EngrStudent
fonte
2
Há também o RPy rpy.sourceforge.net , R como uma biblioteca para Python, para que você obtenha os aspectos atualizados e livres de erros comprovados do R com a simplicidade sintática do Python.
Ghillie Dhu
1
"eles treinam os usuários para apertar botões e se o usuário quiser ir para outro lugar (JMP ou o que for), não haverá transferência de aprendizado". O SAS, um programa proprietário, não treina muito bem para "apertar botões", e ter problemas para transportar entre idiomas diferentes dificilmente é um recurso exclusivo do software proprietário. Heck, eu estava mais em casa indo de Sysstat a JMP do que eu era de Python para R.
fomite
@Epigrad - eu assisto desligar os cérebros dos engenheiros o tempo todo. Dezenas e dezenas de pessoas. Fico feliz que você tenha encontrado utilidade para isso, mas espero fortemente que você seja um discrepante e que a tendência geral de danos não seja substancialmente alterada pela sua experiência.
EngrStudent
@EngrStudent: Obrigado pelo seu esforço para experimentar o Statistical Laboratory! A configuração do menu para o idioma inglês é de fato não intuitiva, mas depois de configurá-lo uma vez, não encontrei mais problemas com o idioma. Infelizmente, não consigo fazer o "R-Graph Wizard" funcionar, embora o R-Graph normal funcione bem se eu inserir algum código R. Portanto, darei aos meus alunos alguns trechos de código de exemplo para produzir gráficos básicos. Talvez eu mudar mais cedo para rstudio ...
não numeric_argument
1

Você pode tentar usar o Gnumeric, um altamente pensado em planilha; também há uma planilha do Open Office. Desde que você explique as armadilhas do uso de planilhas, particularmente o Excel, depois da faculdade em suas vidas práticas subseqüentes, eles podem não ter o luxo de algo como o SPSS, mas ainda podem obter serviços úteis desses produtos gratuitos que não exigem muito de matemática e habilidades de programação . Muitos ambientes de escritório contêm o Excel por padrão.

Dê uma olhada em:

http://groups.google.com/group/sci.stat.math/browse_thread/thread/26fe9a9a0d91139d# - Statistics e Excel 2007

e procure referências semelhantes, como

http://groups.google.com/group/comp.soft-sys.stat.spss/browse_frm/thread/3940bcd6c6266f1b/d85edd4978e53568?hl=pt_BR#d85edd4978e53568 Keeling, Kellie B. & Pavur, Robert J. (2007). Um estudo comparativo da confiabilidade de nove pacotes de software estatístico. Estatística Computacional e Análise de Dados, 51, 3811–3831.

Robert Jones
fonte
1

Eu fui CalEst . A licença é barata, como 10 dólares e fornece cálculos / gráficos, além de ótimas simulações / atividades para os alunos praticarem. Além disso, em seu site, eles têm algumas ferramentas, principalmente em distribuições que você pode achar úteis.

Octavio Duran
fonte
Esta resposta é um pouco curta. Você poderia entender um pouco mais por que você proporá esse software e quais vantagens ele comparou com a concorrência?
Kjetil b halvorsen
1

Nós começamos a usar o Rguroo. Este software foi lançado recentemente. É baseado em R, mas nenhum conhecimento de codificação de R é necessário. Também é um aplicativo da Web, para que você simplesmente faça login em um navegador. Meus alunos podem salvar seu trabalho em qualquer estágio e voltar para concluir seu trabalho. A interface gráfica do usuário é muito intuitiva e as saídas são ótimas.

Marie
fonte
0

Temos usado a versão beta do Rguroo em nossos cursos introdutórios de estatística na California State University, Fullerton, nos últimos três anos. Eles já lançaram (agosto de 2019) uma versão oficial, consulte https://Rguroo.com. Este é um software estatístico de aplicativo da web que funciona em qualquer navegador. Este software foi desenvolvido para o ensino e oferece uma demonstração individual e treinamento para professores; basta enviar um e-mail ou ligar para agendar uma demonstração. O software executa o R em segundo plano, mas você não precisa conhecer o R, basta apontar e clicar. Possui muitos recursos excelentes, incluindo resultados detalhados, ótimas ferramentas gráficas, calculadora de probabilidade e ferramentas de simulação. Gosto especialmente dos recursos de reprodutibilidade, onde você pode salvar seu trabalho a qualquer momento e voltar e continuar de onde parou. Você também pode compartilhar seu trabalho com os alunos através do que eles chamam de arquivos RGR. Resumindo ... é ótimo e continuamos a usá-lo.

Mori J
fonte
0

Eu pessoalmente uso o software DataMelt para o ensino de estatística. Está muito bem documentado, tem tutoriais, livros e muitos exemplos para analisar. O que também é importante é que se pode procurar qualquer exemplo e você pode obter uma resposta razoável (em Javadoc e trechos de código). Os alunos podem aprender não apenas Python (que é a linguagem de programação padrão), mas também como codificar métodos estatísticos em Java. Na minha opinião, essa é uma força significativa: os alunos não precisam aprender uma linguagem "estatística" muito especializada, como o R-stat. Eles também podem aprender Java ao mesmo tempo, o que pode abrir muitas oportunidades se decidirem ir para o setor.

J.Removel
fonte
-1

Existe um novo software chamado Rguroo, que é um aplicativo da web. É muito conveniente de usar, pois não requer downloads ou instalação. O Rguroo possui um mecanismo R, mas seu uso não requer codificação R, pois permite usar o poder do R usando a interface gráfica de apontar e clicar. Toda análise é salvável e reproduzível. Temos usado esse software em nossos cursos introdutórios e intermediários de estatística nos últimos três anos. Neste ponto, é gratuito e você pode criar uma conta em www.Rguroo.com. Com base nas informações que tenho, permanecerá livre para todos os professores e terá uma taxa de assinatura anual razoável, entre 10 e 20 dólares, para os alunos.

Mori J
fonte