Como passar recursos extraídos usando a CNN para a RNN?

Tenho imagens de palavras como abaixo: Digamos que é uma 256x64imagem. Meu objetivo é extrair o texto da imagem, 73791096754314441539que é basicamente o que um OCR faz. Estou tentando construir um modelo que possa reconhecer palavras de imagens. Quando estou dizendo palavra, pode ser uma das...