Perguntas com a marcação «gensim»

29
Por que o xgboost é muito mais rápido que o sklearn GradientBoostingClassifier?

Estou tentando treinar um modelo de aumento de gradiente com mais de 50 mil exemplos com 100 recursos numéricos. XGBClassifierlida com 500 árvores em 43 segundos na minha máquina, enquanto GradientBoostingClassifierlida com apenas 10 árvores (!) em 1 minuto e 2 segundos :( Não me preocupei em...

21
Como carrego o modelo pré-treinado FastText com o Gensim?

Tentei carregar o modelo pré-treinado fastText a partir daqui, modelo Fasttext . Estou usando wiki.simple.en from gensim.models.keyedvectors import KeyedVectors word_vectors = KeyedVectors.load_word2vec_format('wiki.simple.bin', binary=True) Mas, mostra os seguintes erros Traceback (most...

14
Doc2vec (gensim) - Como posso inferir o rótulo de frases invisíveis?

https://radimrehurek.com/gensim/models/doc2vec.html Por exemplo, se treinamos o doc2vec com "aaaaaAAAAAaaaaaa" - "rótulo 1" "BbbbbbBBBBBbbbb" - "rótulo 2" podemos inferir que “aaaaAAAAaaaaAA” é o rótulo 1 usando o Doc2vec? Eu sei que o Doc2vec pode treinar vetores de palavras e rótulos. Usando...