Quantos parâmetros possui um único LSTM empilhado? O número de parâmetros impõe um limite inferior ao número de exemplos de treinamento necessários e também influencia o tempo de treinamento. Portanto, conhecer o número de parâmetros é útil para treinar modelos usando LSTMs.
deep-learning
rnn
wabbit
fonte
fonte
No entanto, caso o seu LSTM inclua vetores de polarização ( este é o padrão no keras, por exemplo ), o número se torna:
fonte
De acordo com isso :
Estrutura celular LSTM
Equações LSTM
Ingoring não linearidades
Se a entrada x_t for do tamanho n × 1 e houver d células de memória, o tamanho de cada um de W ∗ e U ∗ será d × n , e d × d resp. O tamanho de W será então 4d × (n + d) . Observe que cada uma das células de memória dd possui seus próprios pesos W ∗ e U ∗ e que os únicos valores de células de memória compartilhados com outras unidades LSTM são durante o produto com U ∗ .
Agradecemos a Arun Mallya pela ótima apresentação.
fonte