Perguntas com a marcação «nlp»

8
Como obter o número de sílabas em uma palavra?

Eu já passei por este post que usa nltk's cmudictpara contar o número de sílabas em uma palavra: from nltk.corpus import cmudict d = cmudict.dict() def nsyl(word): return [len(list(y for y in x if y[-1].isdigit())) for x in d[word.lower()]] No entanto, para palavras fora do dicionário do cmu,...

7
Lidando com diversos dados de texto

Atualmente, estou trabalhando com um conjunto de dados com uma ampla variedade de comprimentos de documentos - de uma única palavra a uma página inteira de texto. Além disso, a estrutura gramatical e o uso da pontuação variam muito de um documento para outro. O objetivo é classificar esses...