Preciso analisar com R os dados de uma pesquisa médica (com mais de 100 colunas codificadas) que vem em um CSV. Vou usar chocalho para algumas análises iniciais, mas nos bastidores ainda é R.
Se eu ler o arquivo.csv () , as colunas com códigos numéricos serão tratadas como dados numéricos. Estou ciente de que poderia criar colunas categóricas a partir delas com factor (), mas fazer isso para mais de 100 colunas é uma dor.
Espero que exista uma maneira melhor de dizer ao R para importar as colunas diretamente como fatores. Ou pelo menos para convertê-los no lugar depois.
Obrigado!
r
categorical-data
data-transformation
wishihadabettername
fonte
fonte
Respostas:
Você pode usar o
colClasses
argumento para especificar as classes das suas colunas de dados. Por exemplo:atribuirá numérico à primeira coluna, fator à segunda e terceira. Como você tem muitas colunas, um atalho pode ser:
ou alguma variação desse tipo (por exemplo, atribuir numérico à primeira coluna, fatorar para as próximas 37 colunas e depois caractere para a última).
fonte
ou apenas depois de ler os dados
embora esse tipo de Q seja provavelmente mais adequado para o estouro de pilha.editar : veja abaixo.
fonte
'T'
e'F'
(é convertido em lógico).