Similaridade e / ou Diferença de dois documentos ODT (Linux)

14

Eu tenho dois documentos ODT, eles têm um conteúdo muito próximo, quero compará-los para ver como eles são semelhantes.

O melhor seria ter uma porcentagem de similaridade , se não for possível, uma alternativa seria pelo menos ter algum tipo de diferença .

Estou executando o Ubuntu Lucid .


Solução:

Eu costumava odt2txtconverter os arquivos em texto e, em seguida, wdiff -i --statistics one.txt two.txtapresentava um diff junto com as estatísticas, o que me dava a porcentagem de palavras comuns (semelhança).

Weboide
fonte

Respostas:

7

Eu não os experimentei, mas esse par de ferramentas - odt2txt e oodiff - parece promissor.

JRobert
fonte
Usei o odt2txt para convertê-los em texto e, em seguida, usei o wdiff, que fornece um diff por palavra.
Weboide
Obrigado. Isso é ótimo para uso em sistemas de controle de versão como git ou mercurial. Veja técnicas de integração / automação no OpenDocument, diff e revision-control
nealmcb
20

Você tentou a funcionalidade de comparação interna? Editar / comparar documento ...

Se você deseja apenas uma comparação de texto, sua melhor aposta é provavelmente converter os dois documentos em texto sem formatação e executar uma comparação regular. Você terá que descobrir como normalizar quebras de linha, caso contrário, o diff não será muito útil.

sleske
fonte
1
Ótima função no LibreOffice, eu nunca tinha ouvido falar sobre isso! Muito útil, mas nenhuma estatística é fornecida.
Stragu
Excelente! Eu nunca teria pensado em procurar em um menu Editar para comparar documentos. Procurei em Arquivo , Ferramentas e Janela , sendo o último o local do Word da uSoft.
wallyk
4
Na versão mais recente, parece ser Edit -> Track Changes -> Compare Document ...
FableBlaze
1

Se você não se importa com a formatação de texto, também pode copiar o conteúdo para arquivos de texto sem formatação e usar um bom e antigo diff.

ps: Você é um professor procurando possíveis trapaceiros? : p

tamtakos
fonte
lol não, eu não sou um professor, mas sim que esta seria uma boa maneira de olhar para cheaters :)
Weboide
1

A maneira como faço isso é produzir arquivos .pdf com o libreoffice e depois usar o diffpdf para comparar os dois arquivos pdf. Isso mostra as diferenças destacadas em janelas paralelas

Peter Allott
fonte