No Ubuntu 12.10, se eu digitar
gnome-screenshot -a | tesseract output
retorna:
** Message: Unable to use GNOME Shell's builtin screenshot interface, resorting to fallback X11.
Como posso selecionar um texto da tela e convertê-lo em texto (área de transferência ou documento)?
Obrigado!
gnome-screenshot -a
? Também por que você canaliza a saída para tesseract? Se eu não estiver errado gnome-screenshot guarda a imagem em um arquivo, e não "imprimir"-lo ...auto-save-directory
? E deixou cair alguma coisa lá? Link interessante: forums.debian.net/viewtopic.php?f=6&t=85683Respostas:
Talvez já exista alguma ferramenta que faça isso, mas você também pode criar um script simples com alguma ferramenta de captura de tela e tesseract, enquanto estiver tentando usar.
Tome como exemplo este script (no meu sistema, salvei-o como
/usr/local/bin/screen_ts
):E com suporte à área de transferência:
Ele usa
scrot
para tirar a tela,tesseract
reconhecer o texto ecat
exibir o resultado. A versão da área de transferência é utilizada adicionalmentexsel
para canalizar a saída para a área de transferência.NOTA :
scrot
,xsel
,imagemagick
etesseract-ocr
não são instalados por padrão, mas estão disponíveis nos repositórios padrão.Você pode substituir
scrot
porgnome-screenshot
, mas pode levar muito trabalho. Em relação à saída, você pode usar qualquer coisa que possa ler um arquivo de texto (abra com o Editor de Texto, mostre o texto reconhecido como uma notificação, etc.).Versão GUI do script
Aqui está uma versão gráfica simples do script OCR, incluindo uma caixa de diálogo de seleção de idioma:
Além das dependências listadas acima, você precisará instalar o YAD do garfo do Zenity a partir do PUP webupd8 para fazer o script funcionar.
fonte
rm $SCR_IMG.png $SCR_IMG.txt
).scrot
por si só não pode usar a área de transferência. Mas existem ferramentas comoxclip
ouxsel
que podem fazer o que você precisa se for para copiar / colar texto.| clipboard
ao final da linha final do script de Salem.Não sei se alguém precisa da minha solução. Aqui está um que corre com wayland.
Ele mostra o reconhecimento de caracteres em um editor de texto e, se você adicionar o parâmetro "yes", obterá a tradução da ferramenta goggle trans (a conexão à Internet é obrigatória). Antes de poder usá-lo, instale o tesseract-ocr imagemagick e o google-trans. Inicie o script, ou seja, no gnome, com Alt + F2 quando vir o texto que deseja reconhecer. Mova a cursor pelo texto. É isso aí. Este script foi testado apenas para o gnome. Para outro gerenciador de janelas, é necessário acomodar. Para traduzir o texto em outros idiomas, substitua o ID do idioma na linha 25.
fonte
Acabei de fazer um blog sobre como usar a captura de tela nos dias modernos. Mesmo tendo como alvo o chinês, mas o elenco e o código da tela estão em inglês. OCR é apenas um dos recursos.
Recurso para meu OCR:
Abra no konsole + vimx OU gedit para editar mais.
Para vimx + english, ative a verificação ortográfica.
Suporte a seleção dinâmica de idioma sem código físico.
Caixa de diálogo Progresso ao converter e executar tesseragens, que são lentas.
Código da função:
Código do chamador:
Combine esse código 2 no script de shell único para executar.
Captura de tela 1:
Captura de tela 2:
fonte
A idéia é sempre que um novo arquivo de captura de tela aparecer na pasta, executar o tesseract OCR e abrir em um editor de arquivo.
Você pode deixar esse script em execução no diretório de saída do seu diretório de saída de captura de tela favorito
Você precisará que este seja instalado
fonte
Criei um programa gratuito e de código aberto para esse fim:
https://danpla.github.io/dpscreenocr/
fonte