Emacs: abra um buffer com todas as linhas entre as linhas X e Y a partir de um arquivo enorme

10

No mesmo espírito que essa outra pergunta: linha X para linha Y em um arquivo enorme :

Existe uma maneira de abrir no Emacs (e mostrar em um buffer) um determinado conjunto de linhas (por exemplo, todas as linhas entre linhas Xe Y) a partir de um grande arquivo de texto?

Por exemplo, abra e mostre em um buffer todas as linhas entre as linhas 57890000 e 57890010 do arquivo huge.txt

Atualização: Estou interessado em uma solução que pelo menos possa abrir as linhas em somente leitura (apenas para fins de exibição), embora seja ótimo se eu também puder editar as linhas (e salvar no arquivo original).

Amelio Vazquez-Reina
fonte
Você só quer vê-lo ou até editá-lo?
choroba 8/09/12
1
Que tal de dentro ed? 57890000,57890010p
Kevin

Respostas:

7

Se você deseja abrir o arquivo inteiro (o que requer), mas mostrar apenas parte dele na janela do editor, use estreitamento . Selecione a parte do buffer em que deseja trabalhar e pressione C-x n n( narrow-to-region). Diga "sim" se você receber uma solicitação sobre um comando desativado. Pressione C-x n w( widen) para ver o buffer inteiro novamente. Se você salvar o buffer, o arquivo completo será selecionado: todos os dados ainda estarão lá, restringir apenas o que você vê.

Se você deseja visualizar uma parte de um arquivo, pode inseri-lo no buffer atual com o shell-commandargumento prefix ( M-1 M-!); execute o comando apropriado para extrair as linhas desejadas , por exemplo <huge.txt tail -n +57890001 | head -n 11.

Há também uma função Lisp insert-file-contentsque pode levar um intervalo de bytes. Você pode invocá-lo com M-:( eval-expression):

(insert-file-contents "huge.txt" nil 456789000 456791000)

Observe que você pode executar o limite de tamanho inteiro (dependendo da versão e da plataforma, verifique o valor de most-positive-fixnum).

Em teoria, seria possível escrever um modo Emacs que carrega e salva partes de arquivos de forma transparente conforme necessário (embora o limite de tamanhos inteiros tornasse impossível o uso de compensações de arquivos reais em máquinas de 32 bits). O único esforço nessa direção que conheço é o VLF (link do GitHub aqui ).

Gilles 'SO- parar de ser mau'
fonte
1

Você pode achar útil essa combinação de perl e elisp . Permite canalizar dados para um buffer. As invocações subsequentes usando o mesmo nome do buffer anexarão as novas linhas ao mesmo buffer.

Você pode "editar" o buffer , mas a edição não reflete de forma alguma a origem (que é um canal ) ... Ela não mostra nenhum número de linha, embora você possa ajustar a entrada para incluir um prefixo numerado para cada linha.

from=50000000
  to=50000010
<file_50 head -n "$to" | tail -n +"$from" | e-sink.pl

No buffer:

<<<<< start: 2012-09-09T01:39:49
1000000
VSjU K97X5Z dFcc ZZd2OqQ PzbnphT
yQBTt LOic Ks sPXrq tty oy
dA8 SD BvO daZ KFPr44X
X0m3BI eR4go YjFp7e vbJr3oe Y0OGgH3 uPfz yfq59
we rm L9iD ugcJBND daS

7pO lwUFzNE HPlPW fmPZ vpRs Rx EFeHaFM
b0 1B ncr Db324 vwO Un34R
HDZS wq9zg W013 5JGly
kAfP QPpjjyh pXMAw I1 CGKDc23 qCBnP
<<<<<   end: 0.630s

Ou, com os números de linha adicionados:

from=50000000
  to=50000010
<file_50 head -n "$to" | tail -n +"$from" | nl -v$from -ba -w${#to} | e-sink.pl

No buffer:

<<<<< start: 2012-09-09T01:53:44
50000000    1000000
50000001    VSjU K97X5Z dFcc ZZd2OqQ PzbnphT
50000002    yQBTt LOic Ks sPXrq tty oy
50000003    dA8 SD BvO daZ KFPr44X
50000004    X0m3BI eR4go YjFp7e vbJr3oe Y0OGgH3 uPfz yfq59
50000005    we rm L9iD ugcJBND daS
50000006    
50000007    7pO lwUFzNE HPlPW fmPZ vpRs Rx EFeHaFM
50000008    b0 1B ncr Db324 vwO Un34R
50000009    HDZS wq9zg W013 5JGly
50000010    kAfP QPpjjyh pXMAw I1 CGKDc23 qCBnP
<<<<<   end: 0.768s

Encontrei isso em um StackOverflow Q / A

Peter.O
fonte