Síntese de fala que requer muito pouco desempenho da CPU?

13

Nos dias de computadores pessoais com CPU de 1 MHz e 8 bits (Apple II, Atari 800, etc.), havia programas de software que podiam fazer síntese compreensível arbitrária de texto para fala nesses PCs. Quais algoritmos de síntese de fala publicados podem ser adequados para implementação em microcontroladores com desempenho e memória igualmente limitados? (Caso existam...)

hotpaw2
fonte
Não sei como eles fizeram isso, mas aqui está um IC allophone-to-audio chamado SpeakerJet e aqui está o gerador de texto para allophone associado. Você pode perguntar o pessoal da speakjet.com como eles fizeram isso ...
Kevin Vermeer
@KevinVermeer - Por que você não postou isso como resposta? Você teria recebido um voto positivo de mim pelo menos, pois isso seria um excelente complemento para minha própria resposta.
Mark Booth

Respostas:

3

Os métodos com os quais eu brincava nos computadores domésticos de 8 bits nos anos 80 envolviam ter um pequeno conjunto de amostras fonéticas e, em seguida, definir o texto que você deseja falar definido em termos dessas amostras.

Como eu não conhecia o IPA na época, usei apenas dois sons por letra e aloquei o som curto em letras minúsculas e sons longos em maiúsculas. No entanto, isso deixou algumas lacunas, o para / ɒ / ( quente ) e O para / oʊ / ( aberto ) eram fáceis, mas / uː / ( oo som na lua ) não podia ser representado no meu sistema, o que foi um problema para mim, dado o meu nome (/ BUD / rimas com / SMUD /, julgá-los em itinerarium s síntese fonema página web).

Hoje em dia, você poderia fazer coisas muito mais inteligentes. Para começar, você pode usar técnicas de pesquisa para traduzir palavras conhecidas no texto ortográfico em seus símbolos fonéticos conhecidos e, para palavras desconhecidas, a implementação do Phonics como um algoritmo deve fazer um trabalho razoável.

Depois de obter seu fluxo fonético, você provavelmente poderá usar técnicas de DMA para transmitir amostras de fonemas individuais da memória para o seu DAC, com menos sobrecarga para a CPU.

Mark Booth
fonte