Como ler arquivos .doc do Word?

10

Como podemos ler arquivos do Microsoft Word ( .doc) em um sistema Linux? Não suporta .docarquivos. eu tentei

strings filename.doc | less

mas dá saída feia. Alguma outra opção?

Eu preferiria uma ferramenta baseada em GUI.

Chankey Pathak
fonte
4
Instale o OpenOffice ou LibreOffice então.
EightBitTony
1
ou abiword, kwrite,
Sirex

Respostas:

18

Se você deseja uma solução gráfica, poderá abri-las com o Open Office ou o Libre Office .

Há também anti-palavras

O Antiword é um leitor gratuito do MS Word para Linux e RISC OS. Existem portas para FreeBSD, BeOS, OS / 2, Mac OS X, Amiga, VMS, NetWare, Plan9, EPOC, Zaurus PDA, MorphOS, Tru64 / OSF, Minix, Solaris e DOS. O Antiword converte os arquivos binários do Word 2, 6, 7, 97, 2000, 2002 e 2003 em texto sem formatação e em PostScript.

catdoc -

O Catdoc é uma ferramenta de decodificação de arquivos do MS Word que não tenta analisar a formatação do arquivo (apenas extrai o texto legível), mas é capaz de lidar com todas as versões do Word e converter codificações de caracteres.

E algumas outras opções mencionadas aqui (linux.com).

EightBitTony
fonte
7

Eu adicionaria docx2txt à lista - principalmente para ler o novo .docxformato amaldiçoado ( Late $ t $ tandard tm ).

rozcietrzewiacz
fonte
3

Eu achei o Abiword um dos mais hábeis em lidar com arquivos de palavras no Linux. A formatação nem sempre é tão próxima quanto o Libre Office (o garotão do quarteirão e sua aposta principal), mas o que acontece geralmente acaba em um formato mais limpo e utilizável.

Caleb
fonte
2

Normalmente, encontro esses quando estou online. Se você estiver usando o Firefox ou um dos seus enteados, recomendo o plug - in do Docs Online Viewer . Um pequeno ícone do globo ocular aparece ao lado de qualquer tipo de documento que ele possa manipular. Basta clicar no globo ocular para ver.

Ele lida com: "PDF, DOC, DOCX, XLS, PPT, RTF, ODT, ODS, ODP, CSV e muitos outros formatos"

Existe uma versão do Chrome, mas eu não a usei.

Menos estático
fonte