Alguém sabe de um R equivalente ao SAS PROC FREQ
?
Estou tentando gerar estatísticas descritivas resumidas para várias variáveis ao mesmo tempo.
r
descriptive-statistics
sas
z0lo
fonte
fonte
Respostas:
Eu uso
table
eprop.table
, masCrossTable
nogmodels
pacote, você pode obter resultados ainda mais próximos do SAS. Veja este link .Além disso, para gerar "estatísticas descritivas para várias variáveis ao mesmo tempo", você usaria a
summary
função; por exemplosummary(mydata)
,.fonte
Resumir dados na base R é apenas uma dor de cabeça. Essa é uma das áreas em que o SAS funciona muito bem. Para R, eu recomendo o
plyr
pacote.No SAS:
com
plyr
:fonte
Eu não uso SAS; portanto, não posso comentar se o seguinte é replicado
SAS PROC FREQ
, mas essas são duas estratégias rápidas para descrever variáveis em um data.frame que costumo usar:describe
inHmisc
fornece um resumo útil de variáveis, incluindo dados numéricos e não numéricosdescribe
inpsych
fornece estatísticas descritivas para dados numéricosR Exemplo
A seguir está a saída de
Hmisc
describe
:Abaixo está a saída de
psych
describe
para as variáveis numéricas:fonte
Eu uso a função do livro de códigos de {EPICALC}, que fornece estatísticas resumidas para uma variável numérica e uma tabela de frequências com rótulos de nível e códigos para fatores. http://cran.r-project.org/doc/contrib/Epicalc_Book.pdf (consulte a p.50) Além disso, isso é muito útil porque fornece sd para variáveis quantitativas.
Desfrutar !
fonte
codebook()
isso explica. Uma questão é quena
são descartados, que você pode incluir na sua saída. Uma maneira de lidar com isso (pelo menos com fatores) é usar ? Recode.is.na 1st (por exemplo, "ausente"); para variáveis numéricas, você pode criar uma nova variável imediatamente à esquerda da coluna com um valor lógico baseado em eis.na()
, em seguida, executarcodebook()
. É um pouco desagradável, no entanto.Você pode conferir meu pacote summarytools ( link CRAN ), que inclui uma função semelhante a um livro de códigos, com opções de formatação de marcação e html.
Resumo do Dataframe
CO2
EDITAR
Nas versões mais recentes das ferramentas de resumo , a
freq()
função (que produz tabelas de frequência diretas, mais objetivas em relação à pergunta original) aceita quadros de dados e variáveis únicas. Para tabulações cruzadas (que também proc proc freq ), consulte actable()
funçãoFrequências
CO2 $ PlantaTipo : Fator Ordenado
CO2 $ TipoTipo : Fator
Tratamento de CO2 $Tipo : Fator
fonte
Obrigado por todas as sugestões todos. Acabei usando a tabela ou a função numSummary do Rcmdr e aplicar:
Isso funciona muito bem e não é muito inconveniente. No entanto, definitivamente vou tentar algumas dessas outras soluções!
fonte