Então, eu tenho esse dump da wikipedia com cerca de 10 GB e chamado "enwiki-latest-pages-articles.xml.bz2". Eu tenho tentado os seguintes comandos no terminal para descompactar o despejo:
tar jxf enwiki-latest-pages-articles.xml.bz2
E
tar xvf enwiki-latest-pages-articles.xml.bz2
Mas os dois retornam o seguinte erro
tar: This does not look like a tar archive
tar: Skipping to next header
command-line
tar
bzip2
Arun Mohan
fonte
fonte
7z
util para extrair tudoRespostas:
Você não pode usar o
tar
comando porque o arquivo morto não é um arquivo .tar. *. Para descompactar um arquivo bzip2, use o seguinte comando (isso não preservará o arquivo .bz2 original):Se você deseja extrair e manter o original, execute este comando:
Fonte: https://superuser.com/questions/480950/how-to-decompress-a-bz2-file
fonte
bunzip2
.Basta usar
bunzip2
:E se for um
gzip
arquivo compactado:fonte