Controle de voz no ambiente de desktop

16

Gostaria de habilitar um sistema que possa responder aos comandos de voz do usuário e executar scripts de acordo com o comando verbal GIVEN.

Idealmente, eu gostaria que o computador estivesse ouvindo constantemente.

Depois de ouvir a palavra "Computador", ele será ativado e ouvirá os comandos por 10 segundos (mais ou menos).

Uma vez ativo, e enquanto estiver ouvindo, gostaria que outro conjunto de palavras-chave pudesse executar scripts.

Por exemplo....

(O computador está ocioso) "Computador" (o computador escuta imediatamente) "Acessar novas MENSAGENS" (MENSAGENS sendo a palavra da moda * IGNORE "ACESSO NOVO" - o computador executa um script e abre a evolução ou a empatia). Pode haver um para o navegador, outro para fechar as janelas e mostrar a área de trabalho, ou realmente um monte de coisas.

Isso é possível?

BorgDomination
fonte

Respostas:

7

Controle de Voz Gnome

Desenvolvido como parte do Google Summer of Code 2007, essa foi uma idéia para desenvolver alguns recursos que melhorarão a usabilidade no Gnome Desktop.

O objetivo é implementar um sistema de controle de voz para desktop. O sistema consiste em um aplicativo que monitorará a entrada de áudio (microfone) e, quando um sinal de áudio significativo for detectado, o software captura, processa e reconhece o sinal e, em seguida, executa a ação desejada no Gnome Desktop. Em um conjunto de ações pode incluir maximizar, minimizar, fechar a janela ativa; abrir um programa específico; alternar de uma área de trabalho para outra; entre outros. O GnomeVoiceControl é implementado em C em conjunto com o CMU Sphinx, que é uma ferramenta de código aberto, criada para converter fala em texto.

Apresentação de slides dos autores

Infelizmente, parece que ele não se desenvolveu muito além dos "objetivos" básicos - no entanto, parece haver alguma atividade adicionando suporte a novos idiomas, como búlgaro e turco este ano.

Para instalar:

sudo apt-get install gnome-voice-control

Ornitorrinco

Existe um projeto interessante chamado ornitorrinco - basicamente, é um front-end do Linux para Dragon Naturally Speaking, executado no Wine.

A reivindicação da fama para este aplicativo é "ele pode até iniciar programas e scripts para Windows ou Linux, por exemplo," start terminal ".

VEDICS

Este é um projeto novo que diz que funciona com a interface do Unity.

A página do projeto diz que reconhece "executar [nome do programa]" - portanto, em teoria, você [nome do programa] pode ser qualquer script que deseja executar.

liberdade de expressão
fonte
Obrigado pela resposta excepcionalmente rápida. Ouvi falar sobre esse programa e o instalei, mas ele não parece ter passado pela configuração - apenas diz "config". Estou surpreso que não tenha havido muito trabalho nessa frente. Existe talvez uma janela equivalente que eu possa correr com vinho?
BorgDomination
11
a versão mais antiga da voz do gnomo que está em sináptica me deu os mesmos resultados. Eu tentei o mais recente do site e ele parecia ficar mais longe, mas nunca consegui que funcionasse corretamente. as dependências manuais eram uma dor para.
Kendrick
3

Simon Escuta

Este é um projeto de código aberto destinado a substituir mouse e / ou teclado pelo reconhecimento de fala desenvolvido inicialmente para pessoas com deficiência física.

Existe um ppa de onde podemos instalar o aplicativo: ppa: grasch-simon-listens / simon

Takkat
fonte
simon funciona apenas com o kde? Parece realmente incrível e eu o instalei, mas não consigo fazê-lo funcionar com o gnome-shell. especialmente gerenciamento de janelas. Se eu quiser mostrar todas as janelas, por exemplo, isso funcionará de maneira diferente no kde env e no gnome env, certo?
27575 Joshua Robison #:
11
As dependências devem ser resolvidas ao instalar no Ubuntu <= 12.04 a partir do ppa, mas eu não tentei recentemente e também não tenho idéia de como isso pode interferir no shell do GNOME. Ainda não existe uma versão para 12.10.
21312 Takkat
3

Google2Ubuntu

O Google2Ubuntu é uma ferramenta que permite controlar o seu computador usando comandos de voz por meio da API de reconhecimento de fala do Google.

Execute os comandos abaixo no terminal para instalar google2Ubuntu,

sudo add-apt-repository ppa:benoitfra/google2ubuntu
sudo apt-get update
sudo apt-get install google2ubuntu

Fonte

Avinash Raj
fonte
1

Reconhecimento de fala do Linux

Ele está sendo desenvolvido para rodar em distribuições Linux, é muito configurável e fácil de estender, suporta dicionários personalizados, reconhecimento baseado em contexto, modo de ditado e macros configuráveis.

Para instalar o Linux Speech Recognition, vá para a página GitHub do projeto . Faça o download do arquivo ZIP e extraia-o.

Em seguida, instale algumas dependências:

sudo apt-get install sox python-argparse libsox-fmt-mp3 mutt xvkbd xautomation

Abra a pasta extraída (Palaver-master) no terminal e execute a instalação:

cd /~Path-to-folder~/Palaver-master/
./setup

Agora é só atribuir uma tecla de atalho para ativar a gravação, para fazer isso, vá para Configurações do sistema ...> Teclado> Atalhos> Atalhos personalizados, clique no botão Mais para adicionar um atalho, nomeie-o como Reconhecimento de voz e defina o comando para:

/~Path-to-folder~/Palaver-master/hotkey

Clique em Aplicar, clique sobre o atalho e atribua uma tecla de atalho para ativar o reconhecimento de voz.

Observe que nenhuma compilação estável foi lançada ainda; portanto, não espere que os comandos sejam totalmente funcionais nesse estágio, muitas frases serão reconhecidas, mas nenhuma ação real será realizada.

Rodrigo Martins
fonte
A partir de agora, o Palaver está morto: github.com/JamezQ/Palaver/issues/110#issuecomment-398646686
user2740
0

Snips.ai

Apenas tentei no pi3 - parece ter um potencial de
execuções no docker

https://snips.ai/

Paul Schneider
fonte
11
Bem-vindo ao Ask Ubuntu. Observe que, se você é afiliado a essa ferramenta, precisa expressá-lo explicitamente em sua postagem; consulte Como não ser um spammer .
Glorfindel
11
O site oficial diz: Código aberto: estamos comprometidos em abrir Snips ao longo do tempo , portanto vale a pena tentar.
Karel