Eu quero calcular um resumo de uma variável em um data.frame para cada combinação única de fatores no data.frame. Devo usar o plyr para fazer isso? Eu estou bem com o uso de loops em vez de aplicar (); portanto, basta descobrir cada combinação única.
r
categorical-data
aggregation
plyr
russellpierce
fonte
fonte
Respostas:
Embora eu ache que
aggregate
provavelmente seja a solução que você está procurando, se você quiser criar uma lista explícita de todas as combinações possíveis de fatores,expand.grid
fará isso por você. por exemploVocê pode fazer um loop sobre cada linha no quadro de dados resultante para extrair registros dos dados originais.
fonte
Veja
aggregate
eby
. Por exemplo, no arquivo de ajuda paraaggregate
:fonte
Aqui está a solução plyr, que tem a vantagem de retornar várias estatísticas de resumo e produzir uma barra de progresso para cálculos longos:
fonte
Além de outras sugestões, você pode achar útil a
describe.by()
função nopsych
pacote. Ele pode ser usado para mostrar estatísticas resumidas das variáveis numéricas nos níveis de uma variável de fator.fonte
Eu, pessoalmente
cast()
, gosto do pacote remodelar por causa de sua simplicidade:fonte
Em
library(doBy)
há também asummaryBy()
função de, por exemplo,fonte