Existe uma ferramenta para dividir um arquivo de texto grande (9 GB) em arquivos menores, para que eu possa abri-lo e examiná-lo?
Alguma coisa utilizável na linha de comando que acompanha o Windows (XP)?
Ou qual é a melhor maneira de dividir? Posso usar o 7z para criar volumes separados e descompactar um deles separadamente? Será legível ou será necessário que todas as outras partes sejam descompactadas no arquivo grande novamente?
Atualizar
Eu montei um script python rápido de 48 linhas que dividia o arquivo grande em arquivos de 0,5 GB, fáceis de abrir, mesmo no vim. Eu só precisava examinar os dados na última parte do log (sim, é um arquivo de log). Cada registro é dividido em várias linhas para que o grep não funcione.
windows-xp
7-zip
text-editing
stefanB
fonte
fonte
grep -n
comhead
etail
para ver trechos do arquivo. Exemplo,grep -n "something" file.txt
retorna95625: something
. Você quer ver essa linha e 9 linhas abaixo dela para um total de 10 linhas:head -n 95635 file.txt | tail -n 10
.Respostas:
Existe um divisor de arquivos do Windows chamado HJSplit
Disponível aqui . O site afirma que pode dividir arquivos de qualquer tipo e tamanho, mas 9 GB é um arquivo grande .
fonte
O pacote GNU Core Utils (disponível aqui para windows) inclui o utilitário Split. Funciona bem para mim :-)
A documentação --help é a seguinte:
Por exemplo, para dividir input.txt em partes de 100 Mb, dividindo apenas no final das linhas,
fornecerá arquivos de saída denominados xaa, xab, xac, etc.
fonte
Outro é o GSplit - de acordo com o site, ele pode dividir arquivos muito grandes (maiores que 4Gb <- desde que eles ultrapassaram o limite de 4Gb, acho que eles também podem usar 9 Gb).
Mas, outra coisa - você diz que deseja dividi-lo em partes menores para poder abri-lo e vê-lo. Parece um arquivo de log muito grande.
Em qualquer caso, para abrir arquivos de texto grandes, recomendo o EmEditor - eles afirmam que podem abrir arquivos muito grandes (até cerca de 250 Gb), e eu o usei no passado para arquivos de até 2 Gb. Mas, de qualquer forma, acho que pode ser uma solução melhor do que dividir.
fonte
Pieces > Type and Size
menu. Você escolhe o número de linhas e o delimitador de linhas em hexadecimal. Por padrão, ele tem o formato Windows CR + LF (0x0D0x0A
).Confira Large Text File Viewer , é ótimo para coisas como esta. A maioria dos arquivadores e divisores separará o arquivo em partes que não podem ser usadas para ler cada parte de dados de forma independente e adequada; é necessário extrair todas elas para recuperar o arquivo.
O Visualizador de Arquivos de Texto Grande é gratuito e portátil.
fonte
echo. > myfile.txt
resolvi o problema do arquivo de log de 818 MB: DPode-se usar o 7-Zip para criar segmentos de arquivo de texto em determinado tamanho (por exemplo, segmentos de 100 MB a partir de um arquivo de log de 1,5 GB).
As opções principais são - Use "Armazenar" em vez de "Compactar" - Use "Dividir em volumes"
Você poderá ver o texto nos arquivos .001 (.nnn).
fonte
Você pode usar o próprio 7zip para dividir os arquivos. (Você pode salvar no formato .zip ou .7z.) Quando você cria o arquivo morto, existe uma opção chamada "Dividir volume, bytes". Basta selecionar o tamanho que você deseja para os pedaços.
E sim, você pode descompactá-los individualmente, se desejar.
fonte
Existe uma ferramenta on-line que divide arquivos de texto se alguém quiser dividir arquivos rapidamente. http://www.textfilesplitter.com .
Funciona muito bem para mim. E divide arquivos respeitando as linhas, o que eu estava procurando. Ele também diz que é do lado do cliente HTML5, portanto é seguro usá-lo. Não sei ao certo o tamanho, mas acho que depende da memória RAM da sua máquina.
fonte
A ideia de ver parte do arquivo antes de decidir o que fazer com ele é para mim a melhor opção.
O aplicativo Large Text Viewer pode ser instalado no Windows através da Microsoft Store e oferece uma opção para cortar o arquivo em pedaços de tamanho. Pode ser que ele use o mesmo editor mencionado anteriormente (nos bastidores), mas a opção para instalá-lo a partir de uma fonte conhecida é melhor IMHO do que os links alternativos oferecidos. Funcionou muito bem para mim.
O único problema ao dividir por tamanho é que ele não necessariamente quebra o arquivo em um bom local; portanto, talvez seja necessário editá-lo para capturar o conteúdo exato desejado.
fonte