Como encontrar o comprimento de uma string (número de caracteres em uma string) sem dividi-lo em R? Eu sei como encontrar o comprimento de uma lista, mas não de uma string.
E as strings Unicode? Como encontro o comprimento (em bytes) e o número de caracteres (runas, símbolos) em uma string Unicode?
Pergunta relacionada:
r
string
unicode
string-length
Igor Chubin
fonte
fonte
x
.Respostas:
Veja
?nchar
. Por exemplo:fonte
nchar(NA)
NA
s. (Embora isso esteja documentado).stri_length
fromstringi
- ele funciona bem com NA e é mais rápido :) Confira meu post!nchar(NA) ## [1] NA
: ver nchar RDocumentationUsar
stringi
pacote estri_length
funçãoPor quê? Porque é o mais rápido entre as soluções apresentadas :)
e também funciona bem com NA
fonte
stri_length('\u0105')
comprimento é um, mas ...stri_numbytes('\u0105')
2 bytes são usadosnchar()
agora tem um contas argumento para NA de:allowNA = FALSE
Você também pode usar o
stringr
pacote:fonte
Confira isso
fonte
A opção keepNA = TRUE evita problemas com o NA
fonte
nchar(NA) ## [1] NA
: ver nchar RDocumentationpode ser necessário converter primeiro um vetor de caractere;
fonte
nchar
. Para entradas de fator,nchar
gerará um erro e, portanto, você precisará fazer a conversão primeiro, como mostra.