Existe uma maneira de pesquisar arquivos PDF usando o poder do grep, sem converter primeiro o texto no
PDF (Portable Document Format) é um padrão aberto para troca de documentos em formato fixo. Use esta tag para indicar perguntas que envolvem arquivos nesse formato e também quando o software estiver gerando / processando esse formato. Quando possível e possível, indicar a versão do documento PDF (conforme recuperado das propriedades do arquivo ou usando "file document_name.pdf"
Existe uma maneira de pesquisar arquivos PDF usando o poder do grep, sem converter primeiro o texto no
Eu tenho um arquivo pdf digitalizado que digitalizou duas páginas em uma página virtual (página em arquivo pdf). A resolução é de boa qualidade. O problema é que tenho que aumentar o zoom ao ler e arrastar da esquerda para a direita. Existe algum comando ( convert, pdftk...) ou script que pode...
Eu tenho uma cópia digitalizada da minha assinatura escrita e preciso aplicá-la a alguns documentos no bloco de assinaturas. Eu costumava fazer isso no Windows o tempo todo, mas agora tenho apenas o Linux. Isso é possível? Como posso adicionar uma imagem de assinatura a um arquivo PDF no Linux...
Recentemente, eu precisava de uma única página em branco em PDF (8,5 "x 11") e percebi que não sabia como criar uma a partir da linha de comando. A emissão touch blank.pdfproduz um arquivo PDF vazio . Existe uma ferramenta de linha de comando que produz uma página PDF vazia
Quando digitalizo documentos orientados para paisagem, os arquivos PDF de saída são retrato e, portanto, todos os visualizadores de PDF exibem os documentos digitalizados em retrato. Na linha de comando, como você gira um arquivo PDF 90 graus? Tentei pesquisar e encontrei várias soluções, mas...
Quando converto um arquivo pdf em vários arquivos jpg usando convert -quality 100 file.pdf page_%04d.jpg Tenho perda de qualidade apreciável. No entanto, se eu fizer o seguinte, não haverá perda de qualidade (perceptível): Inicie o gscan2pdf, escolha arquivo-> importar (e escolha...
Quero exibir os pdfarquivos diretamente em nosso cluster, em vez de copiá-los para minha máquina local e abri-los em um visualizador. Como posso visualizar um pdfarquivo no meu
Eu fiz algo como convert -page A4 -compress A4 *.png CH00.pdf Mas a 1ª página é muito maior que as páginas subseqüentes. Isso acontece mesmo que as dimensões da imagem sejam semelhantes. Essas imagens são digitalizadas e cortadas, portanto, podem ter pequenas diferenças nas dimensões Eu pensei...
Eu quero converter .txtarquivos para .pdf. Estou usando isso: ls | while read ONELINE; do convert -density 400 "$ONELINE" "$(echo "$ONELINE" | sed 's/.txt/.pdf/g')"; done Mas isso produz um "erro" - se houver uma linha muito longa no arquivo de texto, ela não será quebrada. Entrada de...
Estou tentando imprimir um simples documento US Letter, mas, por algum motivo, não consigo ajustá-lo adequadamente ao A4 ao imprimir várias páginas por lista. Eu tentei converter o pdf usando: gs -o print.pdf -sDEVICE=pdfwrite -sPAPERSIZE=a4 -dFIXEDMEDIA -pPDFFitPage -dCompatibilityLevel=1.4...
Os formulários XFA são recursos de um arquivo pdf que envolve opções para preencher campos em determinados documentos - em muitos casos, documentos oficiais. Essas opções podem abrir um calendário, por exemplo, para selecionar dia, mês e ano, etc. Geralmente, esses formulários garantem a utilização...
Para scripts, preciso obter as dimensões da página de um arquivo PDF (em mm). pdfinfo apenas imprime em 'pts', por exemplo: Page size: 624 x 312 pts O que devo usar? Ou que unidade é 'pts' de qualquer maneira - no caso de eu querer convertê-los
Suponha que eu tenha um PDF e deseje obter os metadados disponíveis para esse PDF. Qual utilitário devo usar? Acho que a informação que mais me interessa é o tamanho do papel, algo que os visualizadores de PDF geralmente não relatam. Por exemplo, a carta do tamanho do PDF é legal, A4 ou outra...
Eu queria saber em um arquivo pdf, como girar páginas em PDF: 90 graus para páginas pares e -90 graus para páginas ímpares? Pelo pdftk, tudo o que sei é girar uma página pdftk in.pdf cat 1W output out.pdfe girar todas as páginas pdftk in.pdf cat 1-endW output
primeiro, peço desculpas se isso já foi solicitado antes - procurei por um tempo nas postagens existentes, mas não consegui encontrar suporte. Estou interessado em uma solução para o Fedora OCR de um pdf não pesquisável de várias páginas e para transformá-lo em um novo arquivo pdf que contenha a...
Ao obter metadados de alguns arquivos pdf com marcadores pdftk, observo o formato dos marcadores nos metadados pdf. Então, eu acho que com pdftkisso, é possível adicionar e editar marcadores de um arquivo pdf. Aqui estão três etapas que eu sigo: Em primeiro lugar, recebo os metadados (incluindo...
Eu sei que já fiz isso antes, então tenho certeza que é possível, apenas esqueço como fazê-lo. Existe uma maneira de dizer ao convert para pegar uma página específica de um PDF e eu gostaria de manter o formato dessa página como
Preciso de arquivos PDF em texto para que eu possa pesquisá-los em massa a partir da linha de comando. Existe algum conversor para Ubuntu, OBSD ou distribuição similar? Talvez post relacionado, OCR com o ubuntu aqui
Preciso proteger com senha meus arquivos PDF, porque vou enviá-los por e-mail e quero que qualquer pessoa que visualize meus arquivos PDF seja solicitada por uma senha. Como posso adicionar uma senha a um PDF no Linux Mint
No GIMP, posso importar um .pdf e usar a GUI para achatá-lo (se ele tiver sido feito com várias camadas) selecionando "Achatar imagem" no menu suspenso "Imagem". Em seguida, posso exportar o arquivo .pdf com um novo nome de arquivo. Eu gostaria de automatizar isso. Existe alguma maneira de fazê-lo...