Quero converter um .pdf
arquivo em um .odt
arquivo para poder convertê-lo ainda mais em um .doc
arquivo. Existe algum software / script que possa fazer isso. Eu tentei copiar o conteúdo do .pdf
arquivo e colei no liberoffice writer a formatação não é preservada.
O documento é confidencial, portanto, prefiro não usar nenhum serviço on-line para a conversão.
Qualquer ajuda é muito apreciada.
format-conversion
Ankit
fonte
fonte
Respostas:
Fiquei irritado com a falta de um conversor gratuito de PDF para ODT. Eu nem precisava de nada complicado. Apenas uma ferramenta que gera arquivos ODT que eu posso anotar no LibreOffice (por exemplo, para preencher formulários).
Eu sei como fazer isso manualmente, convertendo o documento PDF em arquivos gráficos e importando-os para o LibreOffice, mas isso fica tedioso rapidamente.
Então, finalmente escrevi um pequeno script de shell que executa todas as etapas necessárias automaticamente. Você pode encontrá-lo em https://github.com/gutschke/pdf2odt
Ele pode receber qualquer número de arquivos PDF e de imagem como entrada e gera um arquivo ODT que pode ser aberto e editado no LibreOffice. As imagens são exibidas como plano de fundo da página, para que você possa escrevê-las livremente. Cada imagem é associada ao seu próprio estilo de página. Lembre-se disso ao inserir quebras de página e ajuste o estilo da página conforme necessário.
Testei o script no Linux e no Mac. Dado que ele precisa apenas de um punhado de ferramentas razoavelmente padrão, deve ser bastante portátil.
fonte
pdf2oo
alguns anos atrás, mas agora parece produzir arquivos corrompidos para o LibreOffice. Este script faz isso e muito mais - obrigado!Você pode dar uma olhada
PDF Utilities
(poppler-utils via Synaptic ou apt-get), que inclui pdftotext :Obviamente, o sucesso dependerá de como o arquivo pdf foi gerado. Se você conseguir o que deseja como um arquivo de texto, poderá salvá- lo como um arquivo .odt.
Edit: Eu esqueci de fornecer a fonte para a citação. É na guia de descrição no Synaptic for
PDF Utilities (based on Poppler).
fonte
pdftohtml
deve ser o mais adequado para a tarefa, porque o HTML pode ser formatado. Em seguida, o HTML pode ser convertido em ODT ou DOC.O LibreOffice é capaz de importar
.pdf
arquivos. Basta abri-lo em uma versão atual do LibreOffice para obter melhores resultados. No entanto, ele abrirá o documento como um desenho, e você poderá convertê-lo apenas em um dos formatos de imagem suportados, não como um documento do Writer.Naturalmente, nem toda formatação é preservada, mas pelo menos algumas.
fonte
Se o pacote poppler-utils estiver instalado, o script Nautilus abaixo (a ser colocado na pasta ~ / .gnome2 / nautilus-scripts como um arquivo executável) ajudará a converter o arquivo PDF em HTML (a opção "-i" pode ser excluída para incluir imagens também), que podem ser abertas com o LibreOffice Writer e salvas como ODT embora o sucesso da conversão de formatação dependa muito de como o PDF é criado.
http://ubuntuone.com/6xI1afyu6QdQvgdCGn0kym
fonte
man pdftohtml
):-noframes : generate no frames. Not supported in complex output mode.
Portanto-noframes
, não terá nenhum efeito com o-c
conjunto.Experimente o Calibre. Ele converte em html e depois em outros formatos. Ele fez um bom trabalho em um arquivo grande (183 páginas) que eu teria que imprimir.
No meu caso, converti-o para um epub, mas, por diversão, converti-o para um .docx que resultou muito bem.
fonte