Existem ferramentas disponíveis para cortar margens de PDF?

44

Eu tenho um ebook que estou tentando ler em formato PDF em um Kindle. Infelizmente, os cabeçalhos e rodapés da página possuem algum conteúdo (número da página e informações sobre direitos autorais, respectivamente), impedindo que o dispositivo dimensione o texto real para corresponder à área de visualização da área utilizável, deixando o conteúdo real muito pequeno para ser lido.

Estão disponíveis várias ferramentas que cortam o espaço em branco, mas o Kindle já faz isso; meu objetivo, por outro lado, é remover o material impresso fora de uma caixa delimitadora definida, e a única ferramenta que encontrei para esse fim é um software comercial moderadamente caro.

Provavelmente eu poderia gerar uma máscara no Inkscape; divida as páginas individuais usando o pdftk, aplique a máscara a cada página individualmente (saída para postscript) e recombine os vários arquivos postscript em um único PDF. No entanto, essas etapas de decodificação / recodificação seriam bastante infelizes em termos de tamanho do documento; algo capaz de operar com um pouco mais de elegância seria o ideal.

Eu tenho todos os principais sistemas operacionais à mão (Windows, várias distribuições modernas de Linux, Mac, etc) para que as soluções não precisem ser restringidas pela plataforma.

Sugestões?

(Eu relatei o problema ao autor, que o mencionou ao editor, que não fez nada sobre o assunto ao longo de mais de um mês, tornando a abordagem de trabalho zero evidentemente improdutiva).

Charles Duffy
fonte

Respostas:

45

Experimente o BRISS . Livre, de código aberto e multiplataforma. Há uma boa discussão sobre isso nos fóruns do MobileRead .

frabjous
fonte
4
Essa é uma bela peça de software; obrigado!
Charles Duffy
1
Irreal! ótimo programa
Fidel
PDF aberto, ele selecionou automaticamente a área a ser cortada, salva em um novo arquivo com a adição de _cropped ao nome do arquivo, basicamente eu não fiz nada - aplicativo incrível!
Rush Frisby
Essa ferramenta preserva todos os gráficos vetoriais em PDF ==> O zoom funciona como antes do corte. Exatamente o que eu precisava.
kiltek 13/11/2015
1
Briss é excelente na medida em que trabalha automaticamente e quase sempre faz um bom trabalho. Em máquinas Linux, você pode obter o resultado com um comando curto em alguns segundos com "briss myfile.pdf". Basta adicionar a seguinte linha ao seu arquivo ~ / .bashrc, adaptando-o ao diretório de instalação do briss: briss () {java -jar ~ / bin / briss-0.9 / briss-0.9.jar -s "$ 1"; }
dominecf
10

Como mencionado em outra resposta, o BRISS é ótimo. Outra ferramenta realmente útil é o k2pdfopt ( http://www.willus.com/k2pdfopt/ ). Essa ferramenta é realmente ótima para pegar um pdf e otimizá-lo para o Kindle (ou qualquer dispositivo com tela menor). Ele funciona muito bem no papel científico de 2 colunas, pois reflete o texto enquanto mantém a equação e as imagens.

Jean-Philippe Jodoin
fonte
4

Como já foi apontado, o k2pdfopt é uma ótima ferramenta.

Se você não se importa de fazer o jailbreak do seu Kindle (e possivelmente de anular a garantia), também existe a opção de usar essa ferramenta diretamente no seu leitor. Isso é implementado por três garfos do mesmo pacote de software:

Eles lidam com várias colunas, permitem refluxo de texto e alteração do tamanho da fonte. Eles até conseguem não destruir fórmulas e imagens científicas quando refletem.

Atualmente, existem problemas menores, como a falta de espaços entre duas palavras de um salto de linha, mas eu os considero sem problemas. Talvez eles sejam corrigidos em uma das próximas versões.

Tim
fonte
3

Você pode usar o ScanTailor para uma ferramenta mais poderosa. Essa ferramenta não apenas corta automaticamente as margens, mas também pode adicionar mais (caso alguém chegue a essa pergunta para a última). Abaixo está o conteúdo de sua página wiki Layout da página :


Nesta fase, você pode ajustar as margens adicionadas à caixa de conteúdo. Existem dois tipos de margens - rígidas e flexíveis.

Margem forte - é aquela entre as linhas sólidas. Eles são definidos pelo usuário. Você pode mover-se sobre qualquer linha sólida, seja uma aresta interna ou externa, ou definir as margens através de valores numéricos.

Margem suave - é aquela entre o sólido e a linha pontilhada. Essas margens são adicionadas automaticamente para trazer o tamanho da página para o mesmo tamanho de outras páginas. Se você vir uma linha pontilhada - isso significa que em algum lugar do projeto há uma página com essa largura (área útil da margem Hard +) e (possivelmente outras) com essa altura.

Essa é uma página grande que causa margens suaves em todas as outras páginas, mesmo que não seja nivelada.

O alinhamento opcional é definido com precisão, adicione uma margem flexível e, se você adicionar, com qualquer uma das peças.

Ooker
fonte
Ele não parece trabalho para arquivos PDF
Oleksiy
Bem, sim, você deve exportá-lo para imagens primeiro #
Ooker
E depois converta-os novamente em PDF. Isso é um exagero, especialmente para PDFs com centenas de páginas, como livros e livros didáticos.
`` #
@Oleksiy bem, exagero ou não depende de sua necessidade, afinal. Se você só precisa do Bloco de Notas, certamente o Word é um exagero. Mas algumas pessoas percebem que o Bloco de Notas não é bom o suficiente para elas. É por causa de ter que lidar com livros e livros que eu preciso esta ferramenta
Ooker
1

Eu também tive esse problema com meu PDF de 1200 páginas digitalizado (não em inglês). Todas as ferramentas, incluindo o Adobe Acrobat (IX a XI), falharam ao aparar o espaço em branco ao redor. A margem da página ímpar diferia daquela nas páginas pares. Para piorar, o tamanho da margem era inconsistente. Como @frabjous apontou, Briss ajudou. No entanto, quando todas as páginas do documento foram sobrepostas, observou-se que um corte não pode ser aplicado, pois não havia espaço em branco efetivo geral (devido a margens inconsistentes)

A única solução foi então dividir o documento PDF em páginas individuais, executá-lo no Briss para remover margens e recombinar. Os passos que segui são:

  1. Dividi este documento em páginas individuais com o Adobe Acrobat IX clicando em Document->Split documentque abriu a seguinte caixa de diálogo: insira a descrição da imagem aqui Esta ação criou 1200 arquivos PDF individuais.
  2. Então eu criei um arquivo em lotes com o seguinte conteúdo:for %%d in (*.*) do "C:\Program Files (x86)\Java\jre6\bin\java" -jar "C:\Users\VM\Desktop\briss-0.9\briss-0.9\briss-0.9.jar" -s %%d
  3. Coloque esse arquivo em lote no mesmo local em que os arquivos PDF 1200 são colocados e executou o arquivo em lote.
  4. Mais uma vez, usei o Adobe Acrobat IX para juntar todos os arquivos PDF em um único arquivo e pronto, eu tinha um PDF com todas as suas páginas com margens brancas mínimas que agora eram fáceis de ler no tablet.

Dica: No conteúdo acima mencionado do arquivo em lotes, eu basicamente corro um FORloop e pego cada arquivo PDF e o passo para o Briss para cortar automaticamente o PDF. Dependendo

  1. onde o Briss está instalado (e arquitetura do computador, por exemplo, x86 ou x64).
  2. onde o Java Run Time Environment está instalado.
  3. O ambiente de tempo de execução Java pode ser baixado gratuitamente a partir daqui
Narayanan
fonte
1

Ler PDFs em um Kindle não é o ideal. Uma maneira ideal é converter os arquivos PDF em um formato que o Kindle reconhecerá usando o MobiCreator para converter arquivos PDF em arquivos .prc para o Amazon Kindle.

1. Baixe e instale a versão COMPLETA do Mobipocket Creator no link abaixo. (Se você optar pela versão mais simples, ela não terá a opção de conversão de PDF.)

http://www.mobipocket.com/en/DownloadSoft/default.asp?Language=EN

2. Quando o Mobipocket Creator estiver em execução, selecione Adobe PDF em Importar do arquivo existente

3. Escolha o arquivo PDF que deseja converter

4. Deixe o resto em paz, a menos que você queira alterar sua pasta de destino e clique em Importar

5. Selecione o arquivo html que acabou de ser criado e clique em Build na barra de ferramentas na parte superior do Mobipocket Creator

6. Clique em Build (você provavelmente obterá alguns erros, mas eu os ignoro)

7. Vá para a pasta de destino, abra a pasta que foi criada com sua publicação

8. Copie o arquivo .prc na pasta Documents do seu Kindle através do cabo USB (se você quiser entregá-lo sem fio, precisará enviá-lo por e-mail e pagar 10 centavos)

Uma das principais dificuldades de ler arquivos PDF no Kindle é a falta de um índice, para que você não possa pular com muita facilidade.

No entanto, existe uma função no Mobipocket Creator para criar um Sumário.

Simon
fonte
O dispositivo é realmente um Kindle DX; ele não tem um built-in leitor de PDF, e é suficientemente grande formato que meus documentos são muito bem com suas margens aparadas.
Charles Duffy
@CharlesDuffy Fine, menos problemas então. Thx para me informar, esperava que funcionou
Simon