Nos dias de computadores pessoais com CPU de 1 MHz e 8 bits (Apple II, Atari 800, etc.), havia programas de software que podiam fazer síntese compreensível arbitrária de texto para fala nesses PCs. Quais algoritmos de síntese de fala publicados podem ser adequados para implementação em microcontroladores com desempenho e memória igualmente limitados? (Caso existam...)
speech-synthesis
hotpaw2
fonte
fonte
Respostas:
Os métodos com os quais eu brincava nos computadores domésticos de 8 bits nos anos 80 envolviam ter um pequeno conjunto de amostras fonéticas e, em seguida, definir o texto que você deseja falar definido em termos dessas amostras.
Como eu não conhecia o IPA na época, usei apenas dois sons por letra e aloquei o som curto em letras minúsculas e sons longos em maiúsculas. No entanto, isso deixou algumas lacunas, o para / ɒ / ( quente ) e O para / oʊ / ( aberto ) eram fáceis, mas / uː / ( oo som na lua ) não podia ser representado no meu sistema, o que foi um problema para mim, dado o meu nome (/ BUD / rimas com / SMUD /, julgá-los em itinerarium s síntese fonema página web).
Hoje em dia, você poderia fazer coisas muito mais inteligentes. Para começar, você pode usar técnicas de pesquisa para traduzir palavras conhecidas no texto ortográfico em seus símbolos fonéticos conhecidos e, para palavras desconhecidas, a implementação do Phonics como um algoritmo deve fazer um trabalho razoável.
Depois de obter seu fluxo fonético, você provavelmente poderá usar técnicas de DMA para transmitir amostras de fonemas individuais da memória para o seu DAC, com menos sobrecarga para a CPU.
fonte