Infelizmente, parece que atualmente não há uma solução que funcione bem o suficiente, mas uma lista enorme de projetos em andamento.
Você pode vasculhar a lista de soluções para ver se há algo que atenda às suas necessidades.
Ornitorrinco :
Sempre existe a possibilidade de executar o Dragon Naturally Speaking usando o WINE . O Projeto Platypus está criando um software para redirecionar a saída do Dragon para qualquer aplicativo Linux / X, e eles estão muito adiantados.
Você definitivamente deveria dar uma olhada nisso.
Este artigo destaca o melhor software de reconhecimento de fala de código aberto para Linux. Observe que alguns dos softwares estão em um estado inicial de desenvolvimento e, portanto, não estão prontos para adoção ampla.
Antes de examinar nossas recomendações, Jasper merece uma menção especial. É uma excelente plataforma de código aberto para o desenvolvimento de aplicativos sempre ativados e controlados por voz. Você pode estar se perguntando por que o HTK não aparece abaixo. Com certeza, o HTK é um popular kit de ferramentas de reconhecimento de fala. Mas o HTK não é elegível para aparecer nas soluções recomendadas. Não porque os direitos autorais sejam de propriedade da Microsoft, mas simplesmente porque é um software proprietário.
Vamos explorar as 6 ferramentas de reconhecimento de voz livre disponíveis. Para cada título, compilamos sua própria página de portal com uma descrição completa e uma análise aprofundada de seus recursos.
Ferramentas de reconhecimento de fala de código aberto
Implementação do DeepSpeech TensorFlow da arquitetura DeepSpeech do Baidu.
Julius Motor de reconhecimento de voz contínuo com vocabulário grande e duas passagens
Software de reconhecimento de fala flexível da Simon
Sistema de reconhecimento de fala CMUSphinx para aplicativos móveis e de servidor
deepspeech.pytorch Implementação do DeepSpeech2 usando o Baidu Warp-CTC.
Kit de ferramentas Kaldi C ++ desenvolvido para pesquisadores de reconhecimento de fala.
Você pode instalar a versão Chromium 11 a partir do ppa ppa:chromium-daily/stable( Como adicionar um PPA ) e adicionar --enable-speech-input ao final do iniciador.
Agora visite este site e whoo! Fala para texto no ubuntu usando html5.
Eu li aqui que se você falar devagar, será mais preciso.
Respostas:
Há um artigo completo na Wikipedia dedicado ao problema.
Infelizmente, parece que atualmente não há uma solução que funcione bem o suficiente, mas uma lista enorme de projetos em andamento.
Você pode vasculhar a lista de soluções para ver se há algo que atenda às suas necessidades.
Ornitorrinco :
Sempre existe a possibilidade de executar o Dragon Naturally Speaking usando o WINE . O Projeto Platypus está criando um software para redirecionar a saída do Dragon para qualquer aplicativo Linux / X, e eles estão muito adiantados.
Você definitivamente deveria dar uma olhada nisso.
fonte
Para obter uma resposta atualizada, aqui está um artigo de março de 2018: Melhores Ferramentas de Reconhecimento de Fala Linux Gratuitas - Software de Código Aberto .
Ferramentas de reconhecimento de fala de código aberto
fonte
Você pode instalar a versão Chromium 11 a partir do ppa
ppa:chromium-daily/stable
( Como adicionar um PPA ) e adicionar --enable-speech-input ao final do iniciador.Agora visite este site e whoo! Fala para texto no ubuntu usando html5.
Eu li aqui que se você falar devagar, será mais preciso.
fonte
freespeech-vr
É um discurso decente de código aberto para mecanismo de texto. Aqui o código fonte ( no Google Code )
Observe que é preciso um pouco de configuração, menos polida que a configuração do Dragon Naturally Speaking.
fonte
Dictanote
Para expandir a resposta de Alaukik, existem aplicativos criados com base nos recursos de reconhecimento de fala do Chrome.
Eu pessoalmente uso o Dictanote (é muito parecido com o Dragon). Aqui está um link para o aplicativo Chrome .
fonte