Ciência de dados

8
Como obter o número de sílabas em uma palavra?

Eu já passei por este post que usa nltk's cmudictpara contar o número de sílabas em uma palavra: from nltk.corpus import cmudict d = cmudict.dict() def nsyl(word): return [len(list(y for y in x if y[-1].isdigit())) for x in d[word.lower()]] No entanto, para palavras fora do dicionário do cmu,...

8
Como treinar dados por lote do disco?

Estou trabalhando em uma rede neural convolucional para classificação de imagens. O conjunto de dados de treinamento é muito grande para ser carregado na memória do meu computador (4 gb), além disso, também preciso tentar algum aprimoramento para equilibrar as classes. Eu estou usando keras. Eu...

8
Como aplicar o gradiente de softmax em backprop

Recentemente, fiz uma lição de casa em que tive que aprender um modelo para a classificação de 10 dígitos do MNIST. O HW tinha algum código de andaime e eu deveria trabalhar no contexto desse código. Meu dever de casa funciona / passa nos testes, mas agora estou tentando fazer tudo do zero (minha...

8
Gradientes sintéticos - qual é o benefício prático?

Eu posso ver dois motivos para usar Gradientes Sintéticos na RNN: Para acelerar o treinamento, corrigindo imediatamente cada camada com o gradiente previsto Ser capaz de aprender sequências mais longas Eu vejo problemas com os dois. Observe que eu realmente gosto de gradientes sintéticos...