Perguntas com a marcação «lstm»

LSTM significa Long Short-Term Memory. Quando usamos esse termo na maioria das vezes, nos referimos a uma rede neural recorrente ou a um bloco (parte) de uma rede maior.

18
Como alimentar LSTM com diferentes tamanhos de matriz de entrada?

Se eu gosto de escrever uma LSTMrede e alimentá-la com diferentes tamanhos de matriz de entrada, como isso é possível? Por exemplo, quero receber mensagens de voz ou de texto em um idioma diferente e traduzi-las. Portanto, a primeira entrada talvez seja "olá", mas a segunda é "como você está?"...

11
O que é LSTM, BiLSTM e quando usá-los?

Eu sou muito novo no aprendizado profundo e estou particularmente interessado em saber o que são LSTM e BiLSTM e quando usá-los (principais áreas de aplicação). Por que o LSTM e o BILSTM são mais populares que o RNN? Podemos usar essas arquiteturas de aprendizado profundo em problemas não...

11
Abandono em quais camadas do LSTM?

Usando uma camada múltipla LSTMcom desistência, é recomendável colocar desistência em todas as camadas ocultas e nas camadas densas de saída? No artigo de Hinton (que propôs o Dropout), ele apenas colocou o Dropout nas camadas densas, mas isso ocorreu porque as camadas internas ocultas eram...

11
Existem bons modelos de linguagem prontos para uso em python?

Estou prototipando um aplicativo e preciso de um modelo de linguagem para calcular a perplexidade em algumas frases geradas. Existe algum modelo de linguagem treinado em python que eu possa usar facilmente? Algo simples como model = LanguageModel('en') p1 = model.perplexity('This is a well...

10
Keras LSTM com séries temporais 1D

Estou aprendendo a usar o Keras e tive um sucesso razoável com meu conjunto de dados rotulado usando os exemplos do Deep Learning for Python da Chollet . O conjunto de dados é de ~ 1000 séries temporais com comprimento 3125 e 3 classes potenciais. Gostaria de ir além das camadas básicas densas,...

8
Gere previsões ortogonais (não correlacionadas) para uma determinada variável

Eu tenho uma Xmatriz, uma yvariável e outra variável ORTHO_VAR. Preciso prever a yvariável usando X, no entanto, as previsões desse modelo precisam ser ortogonais e, ao ORTHO_VARmesmo tempo, estar o mais correlacionadas ypossível. Eu preferiria que as previsões fossem geradas com um método não...