Hoje descobri acidentalmente que o .docx é o mesmo .zip (ou não há grande diferença entre eles). Quando você altera o .docx para o .zip e abre com o WinRAR, você vê vários arquivos XML nas pastas. Nesse arquivo XML, é armazenado o texto, fontes, proprietário, última modificação e assim por diante. Em uma palavra, todas as informações estão sendo armazenadas como dados XML.
Mas o mesmo não é adequado para arquivos de extensão .doc. É impossível abri-los como .zip ou .rar.
Então, pergunta: Qual é a vantagem de armazenar dados do .docx em XML que a Microsoft mudou a maneira de armazenar dados? Na verdade, quero saber não a vantagem do formato XML, mas por que a Microsoft está usando vários arquivos XML para armazenar os dados .docx. Acontece que .docx não é um novo formato na raiz.
fonte
Respostas:
Um
.docx
arquivo pode armazenar recursos incorporados, como arquivos de imagem, não apenas arquivos XML. Em vez de codificar coisas em base64 ou algo assim e armazená-las em um arquivo XML ou inventar outro formato de serialização binária, eles decidiram usar o formato ZIP padrão.Além disso, XML é um formato de arquivo muito detalhado que contém muitos padrões redundantes. Você pode obter uma alta taxa de compactação para arquivos XML.
A propósito, eu realmente não entendo a parte "enganando-nos". É melhor inventar um novo formato de arquivo criptográfico do zero ou usar um formato padrão conhecido?
fonte
O artigo da Wikipedia resume muito bem:
"A Microsoft ficou sob crescente pressão para adotar um formato de arquivo aberto, em particular várias nações adotaram regras de que os documentos oficiais deveriam estar em um formato aberto".
Editar: E compactá-lo faz muito sentido, pois o XML é muito detalhado e naturalmente comprime muito bem.
fonte
Usar um arquivo .zip renomeado é uma prática bastante comum - por exemplo, arquivos .pak do Quake III são realmente arquivos .zip. Não faz sentido inventar seu próprio formato de arquivo compactado quando já existem perfeitamente bons.
fonte
.jar
, Winamp.wsz
/.wal
(skins), Firefox.xpi
(XPInstaller - temas, complementos). (tar
Arquivos também são populares.)Não é apenas o Office Open XML que usa XML compactado. O OpenDocument do Open Office faz o mesmo nos bastidores.
Existem algumas vantagens listadas na página da Wikipedia nas Convenções de embalagem aberta :
fonte
O maior benefício é que você pode acessar seus dados descompactando o arquivo e copiando o texto dos arquivos xml. Isso pode ser feito com um utilitário zip e um editor de texto, mesmo se você não tiver uma cópia do Word 2007.
É isso que torna o formato mais aberto que os formatos binários mais antigos.
fonte