Perguntas com a marcação «edit-distance»

8
Quais são algumas maneiras eficientes de encontrar as diferenças entre dois grandes grupos de texto que possuem conteúdo semelhante, mas diferentemente ordenado?

Eu tenho dois arquivos grandes que contêm parágrafos do texto em inglês: O primeiro texto tem cerca de 200 páginas e 10 parágrafos por página (cada parágrafo tem 5 sentenças). O segundo texto contém quase exatamente os mesmos parágrafos e texto que o primeiro. Também tem 200 páginas, com 10...