Perguntas com a marcação «nltk»

29
Por que o xgboost é muito mais rápido que o sklearn GradientBoostingClassifier?

Estou tentando treinar um modelo de aumento de gradiente com mais de 50 mil exemplos com 100 recursos numéricos. XGBClassifierlida com 500 árvores em 43 segundos na minha máquina, enquanto GradientBoostingClassifierlida com apenas 10 árvores (!) em 1 minuto e 2 segundos :( Não me preocupei em...

15
Semelhança entre duas palavras

Estou procurando uma biblioteca Python que me ajude a identificar a semelhança entre duas palavras ou frases. Farei a conversão de áudio em texto, o que resultará em um dicionário em inglês ou em palavras que não sejam do dicionário (este pode ser um nome de pessoa ou empresa). Depois disso,...

8
Chunking complexo com NLTK

Estou tentando descobrir como usar o chunker em cascata do NLTK conforme o Capítulo 7 do livro do NLTK . Infelizmente, estou tendo alguns problemas ao executar medidas de fragmentação não triviais. Vamos começar com esta frase: "adventure movies between 2000 and 2015 featuring performances by...