Meu scanner está quebrado! Eu tenho uma boa câmera, então tirei algumas fotos dos documentos que quero digitalizar ... No entanto, eles parecem fotos de papel, não documentos digitalizados:
- As imagens não são planas
- A iluminação não é uniforme (sombras à medida que a página distorce, etc.)
- Obviamente, o texto não é processado em texto PDF passível de cópia.
Eles simplesmente não são adequados para uso profissional, mas estão próximos.
Estou procurando por alguma coisa (ou método) que possa executar uma ou todas as opções acima, para que eu possa ir de vários arquivos JPG para um único PDF anotado [opcionalmente] da coisa toda, no formato certo (A4 tipicamente).
Alguma sugestão (exceto sair e comprar um novo scanner)?
pdfjoin
para costurá-los. Não há OCR.Respostas:
Existem várias maneiras de fazer isso. Embora todas as minhas maneiras sugeridas tenham um problema, elas não serão realmente nítidas. Uma imagem mais ou menos boa ainda seria necessária.
Uma maneira fácil é experimentar o software ScanTailor
Leva você a 6 etapas para otimizar suas fotos. Na última etapa, você pode selecionar a opção "Equalizar iluminação", para obter uma aparência limpa e agradável!
Pessoalmente, geralmente apenas uso o GIMP . Mas você precisa de algumas habilidades básicas para alcançar seu objetivo.
Colors
->Curves
para manipular a saída de cores da maneira que desejar ...Outro pequeno programa interessante é o gscan2pdf , onde você também pode carregar fotos e exportá-las como PDF. Existe até um link para o GIMP, para que você possa melhorar a foto com as etapas descritas acima .
fonte
convert file.tiff file.pdf
no console.find -maxdepth 1 -name '*.tif' -exec convert {} {}.png \;
e depois juntá-laspdfjoin --outfile output.pdf --a4paper --rotateoversize false *.png
. Apenas pensando em voz alta para quando eu esquecer como fazer tudo isso :) Obrigado novamente.Para gerar uma cópia imprimível ou PDF a partir da foto da câmera de um documento, temos que converter manualmente bastante para obter uma imagem semelhante à saída de um scanner. A maioria dessas conversões pode ser feita com o Gimp.
Tente fazer o melhor possível da imagem original :
Considere a dessaturação em escala de cinza para melhor contraste e remoção de artefatos de pixel colorido.
Ajuste o brilho e o contraste para tornar o fundo cinza presumivelmente branco, e as letras pretas ficarão pretas.
Remover distorção da almofada?
Dependendo da qualidade da lente fotográfica e do nível de zoom que usamos, podemos ter alguns artefatos de almofada que levam à curvatura das bordas externas do documento. Existem plugins para remover esses artefatos, mas podemos achar mais rápido escolher um nível de zoom da câmera onde eles são mínimos. Após o corte (5.), podemos nem notá-los mais. Portanto, a remoção de artefatos de almofada pode ser necessária apenas no caso de nossa imagem de origem ter muitas linhas retas nas partes externas.
Gire e corte ou perspectiva transforme a imagem, se necessário.
Ao contrário de um scanner, nossa câmera pode não obter a fonte paralelamente às bordas da imagem. A ferramenta Gimp Rotate ou Perspective fornecerá um feedback visual para poder rotacionar ou ajustar a perspectiva de uma imagem até que as linhas de texto estejam paralelas à página.
Ferramenta de perspectiva no lado direito
Agora podemos selecionar a fonte do documento com a ferramenta de seleção de retângulo para cortar a imagem dentro do documento.
Remova sombras indesejadas de artefatos de dobras, dobras ou vinhetas da lente da câmera.
O método mais rápido, portanto, é simplesmente usar a ferramenta borracha para remover todas as sombras feias fora do texto (que devemos poupar).
apagado ->
Escala de imagem?
Dependendo da resolução da câmera, escalar a imagem para um tamanho de imagem de scanner aumentará apenas o tamanho do arquivo, mas não terá benefícios na qualidade da imagem. Escalar para baixo removerá detalhes. Portanto, não devemos dimensionar a imagem, mas ajustar o tamanho da impressão na caixa de diálogo da impressora (ou abaixo em 8.).
Gerar PDF
Podemos importar nossa imagem agora restaurada manualmente para o LibreOffice ( Inserir> Mídia ) para
fonte
Se você já possui a imagem do documento, basta baixar o aplicativo CamScanner no seu telefone / tablet. Isso permitirá que você importe a imagem e, em seguida, faça um corte sugerido, além de achatar e ajustar cores / contraste, etc. Leva apenas um minuto.
fonte