Perguntas com a marcação «nlp»

O processamento de linguagem natural (PNL) é um campo da ciência da computação, inteligência artificial e linguística, relacionado às interações entre computadores e linguagens humanas (naturais). Como tal, a PNL está relacionada à área de interação humano-computador. Muitos desafios na PNL envolvem o entendimento da linguagem natural, isto é, permitindo que os computadores obtenham significado das informações humanas ou da linguagem natural, e outros envolvem a geração da linguagem natural.

29
Por que o xgboost é muito mais rápido que o sklearn GradientBoostingClassifier?

Estou tentando treinar um modelo de aumento de gradiente com mais de 50 mil exemplos com 100 recursos numéricos. XGBClassifierlida com 500 árvores em 43 segundos na minha máquina, enquanto GradientBoostingClassifierlida com apenas 10 árvores (!) em 1 minuto e 2 segundos :( Não me preocupei em...

22
Qual é a melhor entrada para o Word2Vec?

Isso é mais como uma pergunta geral da PNL. Qual é a entrada apropriada para treinar uma incorporação de palavras, ou seja, Word2Vec? Todas as frases pertencentes a um artigo devem ser um documento separado em um corpus? Ou cada artigo deve ser um documento no referido corpus? Este é apenas um...

21
Como carrego o modelo pré-treinado FastText com o Gensim?

Tentei carregar o modelo pré-treinado fastText a partir daqui, modelo Fasttext . Estou usando wiki.simple.en from gensim.models.keyedvectors import KeyedVectors word_vectors = KeyedVectors.load_word2vec_format('wiki.simple.bin', binary=True) Mas, mostra os seguintes erros Traceback (most...

16
PNL - O Gazetteer é um trapaceiro?

Na PNL, existe o conceito de Gazetteerque pode ser bastante útil para criar anotações. Tanto quanto eu entendo: Um gazetteer consiste em um conjunto de listas contendo nomes de entidades como cidades, organizações, dias da semana etc. Essas listas são usadas para encontrar ocorrências desses...