Acabei de descobrir a comment
função em R. Exemplo:
x <- matrix(1:12, 3,4)
comment(x) <- c("This is my very important data from experiment #0234",
"Jun 5, 1998")
x
comment(x)
Esta é a primeira vez que deparei com essa função e fiquei imaginando quais são os usos comuns / úteis dela. Como é bastante difícil pesquisar "R comment" no google e encontrar resultados relevantes, eu esperava que alguém aqui pudesse compartilhar sua experiência.
Respostas:
Para secundar @Gavin, Frank Harrell desenvolveu maneiras eficientes de manipular data.frame anotado em R em seu pacote Hmisc . Por exemplo, as funções
label()
eunits()
permitem adicionar atributos dedicados aos objetos R. Eu os acho muito úteis ao produzir um resumo do data.frame (por exemplo, comdescribe()
).Outra maneira útil de usar esse atributo extra é aplicar um registro de data e hora em um conjunto de dados. Também adiciono um atributo para coisas como semente aleatória, número da dobra (quando eu uso a validação cruzada k-kold ou LOO).
fonte
Uma coisa que costumo fazer nos meus scripts R para uma tarefa de análise de dados específica é incluir comentários no script sobre as unidades de variáveis nos meus quadros de dados. Trabalho com dados ambientais e químicos e ecologistas parecem gostar de usar uma ampla gama de unidades diferentes para as mesmas coisas (mg L vs mu eq L , etc.). Meus colegas geralmente armazenam essas informações na linha imediatamente abaixo dos nomes das colunas nas planilhas do Excel.- 1 - 1
Eu consideraria
comment()
uma boa maneira de anexar essas informações a um quadro de dados para referência futura.fonte
comment()
não há comentários no código. Ele anexa um atributo específico ao objeto que pode ser um vetor, um elemento por coluna do quadro de dados que contém as informações das unidades. É fácil extrair essas informações, então não vejo por que implementar algo seria difícil ou impossível?R
definitivamente não é o lugar certo para manter bancos de dados e executar processos desse tipo, mesmo que seja capaz de fazê-lo. É melhor complementado por um bom sistema de gerenciamento de banco de dados para esse trabalho.comment()
et al são úteis para notas e informações ad hoc, mas é necessário um sistema adequado para o tratamento de dados em maior escala. Curiosamente, estamos tendo que resolver isso agora dentro do grupo de pesquisa e consultoria em que trabalho em relação aos nossos dados químicos e precisando colocá-los em um banco de dados adequado.Instalações semelhantes existem em outros pacotes, como o comando -notes- no Stata . Usamos isso para documentar detalhes completos de uma variável, por exemplo, detalhes do ensaio para uma medida bioquímica ou a formulação exata da pergunta solicitada para dados do questionário. Geralmente, são muitas informações para o nome ou rótulo da variável, um ou ambos exibidos na saída de todas as análises que envolvem a variável e, portanto, devem ser mantidos razoavelmente curtos.
fonte
Uma das coisas que me vejo fazendo muito é rastrear os comandos usados para gerar dados e objetos, e achei o comentário uma ferramenta útil para isso.
O 'matched.call.data' e 'generate.command.string' fazem o truque. Não é perfeito, mas útil e um uso para 'comment ()'. :)
fonte
Permita-me sugerir minha solução geral para gerenciamento de objetos em R: o
repo
pacote. Com ele, você pode atribuir a cada variável um nome longo, uma descrição, um conjunto de tags, um URL remoto, relações de dependência e também anexar figuras ou arquivos externos genéricos. Por exemplo, o código-fonte pode ser armazenado como um item de repositório e anexado aos recursos produzidos por ele. Encontre a versão estável mais recente no CRAN (install.packages("repo")
) ou o desenvolvimento mais recente no github . Uma rápida visão geral aqui . Espero que ajude.fonte