Como transformar um arquivo Safari Webarchive em uma pasta?

16

Entendo que um arquivo da web do Safari é um único arquivo com o código fonte e outros recursos de uma página da web concatenada em um único arquivo. Eu encontrei um artigo da Macworld de 2006 descrevendo um programa que faz exatamente isso, mas o link para o programa não é mais atual.

Existe algum software atualmente disponível que possa converter um arquivo webarquivo do Safari em um formato mais padrão?

Daniel
fonte

Respostas:

7

WebArchiveExtractor

Eu recomendo o WebArchiveExtractor. Você pode arrastar arquivos .webarchive para este aplicativo, que extrairá o arquivo em seus arquivos individuais em uma pasta.

Você pode personalizar a saída nas Preferências, incluindo a configuração de um nome de arquivo de índice personalizado:

WebArchiveExtractor é de código aberto no GitHub

grg
fonte
O WebArchive Extractor não está funcionando para mim em 9 de dezembro de 2019. Estou usando o Mojave do macOS 10.14.4 (18E226) em um arquivo .webarchive do Safari.
Merchako
11

Existe algum software atualmente disponível que possa converter um arquivo webarquivo do Safari em um formato mais padrão?

Se você estiver textutilfamiliarizado com a linha de comando, existe uma ferramenta no Mac OS para converter arquivos de arquivamento da web em txt, html, rtf, rtfd, doc, docx, wordml ou odt.

Exemplo:
textutil -convert html /Users/USERNAME/NAME.webarchive


Para converter arquivos webarquivos em pdf, tente "Wondershare PDF Editor for Mac". http://www.wondershare.com/pdf/how-to-convert-webarchive-to-pdf.html

Ivan Chau
fonte
4
A textutilferramenta de linha de comando extrai apenas o arquivo html de nível superior, e não o CSS ou scripts que também fazem parte do arquivo da web. (Qual é realmente o objetivo principal do arquivo da web). Não encontrei uma boa maneira alternativa de fazer isso na linha de comando.
Stephen Harrison
11
O @Stephen WebArchiveExtractor possui uma ação do Automator que pode ser executada por script através do shell.
grg
Apesar das advertências, esse é o tipo de resposta que eu estava procurando. Uma solução de base da GUI é bastante inútil quando você deseja converter centenas de arquivos da web em um servidor.
7
Isso nem extrai o arquivo HTML original, mas o converte. É realmente mais como abrir um arquivo HTML no TextEdit e reexportá-lo.
sam