(reformulando a questão para melhor clareza.)
Suponha que eu tenha 1000 arquivos de texto. Cada arquivo é um formato textual, com descrições de campos e cabeçalhos fixos, mas os dados são diferentes. Por exemplo, arquivo 1:
The Foo Factory Date: 2015-10-02 Order Details ------------------------- Order ID: [ 1 ] Amount: [ 1 ] Order Price: [ 12.34 ] Have a nice day.
e arquivo 2:
The Foo Factory Date: 2016-01-11 Order Details ------------------------- Order ID: [ 7 ] Amount: [ 17 ] Order Price: [ 543.21 ] Have a nice day.
Agora, suponha que eu tenha ido em frente e traduzido as descrições dos campos para o francês; e eu apaguei os valores. Então agora eu tenho:
L'usine Foo Date: Détails de commande ------------------------- Nm.du Commande: [ ] Montant: [ ] Prix du Commande: [ ] Bonne journée.
Eu realmente não falo francês, então ignore qualquer erro aqui. De qualquer forma, as posições de todos os campos são exatamente as mesmas, mas o texto sem valor de campo é diferente. Quero aplicar esta substituição a todos os arquivos. Como faço para conseguir isso?
Respostas:
Você já gerou o mapa de formatação, portanto, o único trabalho restante é a substituição de regex. Gerar o mapa é mais difícil, especialmente para textos maiores e mais complicados. Eu uso Sublime Text para isso. Mas o caso de uso e outras informações não estão claros aqui, você deve levá-lo ao softwarerecs.SE se for importante. Estou incluindo uma versão Python de qualquer maneira:
fonte