Como podemos copiar texto da Wikipedia sem as partes de citação “[1]”, “[2]”, “[3]”?

9

Se copiarmos o texto de uma página da Wikipedia , é mais ou menos o que obtemos:

O espaçamento entre frases é o espaço horizontal entre as frases no texto digitado. É uma questão de convenção tipográfica. [1] Desde a introdução da impressão de tipo móvel na Europa, várias convenções de espaçamento entre frases foram usadas em idiomas com um alfabeto derivado do latim. [2] Isso inclui um espaço normal de palavras (entre as palavras de uma frase), um único espaço ampliado, dois espaços completos e, mais recentemente em mídia digital, nenhum espaço. [3] Embora as fontes digitais modernas possam ajustar automaticamente um espaço de uma única palavra para criar um espaçamento visual agradável e consistente após a pontuação do terminal, [4] a maioria dos debates é sobre se a barra de espaço de um teclado deve ser tocada uma ou duas vezes entre as frases. [5]

Não desejo copiar as partes [1]e [2]etc. Isso é realmente o que eu queria copiar:

O espaçamento entre frases é o espaço horizontal entre as frases no texto digitado. É uma questão de convenção tipográfica. Desde a introdução da impressão de tipo móvel na Europa, várias convenções de espaçamento entre frases foram usadas em idiomas com um alfabeto derivado do latim. Isso inclui um espaço normal de palavras (entre as palavras de uma frase), um único espaço ampliado, dois espaços completos e, mais recentemente em mídia digital, nenhum espaço. Embora as fontes digitais modernas possam ajustar automaticamente um espaço de uma única palavra para criar um espaçamento visual agradável e consistente após a pontuação do terminal, a maioria dos debates trata da possibilidade de pressionar a barra de espaço de um teclado uma ou duas vezes entre as frases.

A resposta selecionada abaixo usa regex, mas não funciona sempre . (Se o próprio texto real contiver [e ]a regex não os remover.)

Existem melhores soluções?

Pacerier
fonte
Essas são referências que provavelmente são importantes porque geralmente sustentam a credibilidade das informações apresentadas. Incluir referências é útil, principalmente para pesquisadores.
Randolf Richardson
@Randolf A inclusão de referências pode ser útil, especialmente para pesquisadores. não para normais seres que querem apenas a informação
Pacerier
O recurso de pesquisa e substituição do seu processador de texto, possivelmente chamado de uma macro, pode ser útil aqui.
Keith
Eu avancei sua pergunta, a propósito, porque eu acho que é uma boa. Com relação às referências, muitas pessoas esperam vê-las, especialmente professores da universidade (se você planeja frequentar uma, você quase certamente descobrirá que a maioria dos professores espera que as referências sejam incluídas em todos os trabalhos de pesquisa que você escrever e provavelmente ouça outros alunos falando sobre referências de tempos em tempos).
Randolf Richardson
Randolf @, quero dizer, eu só quero armazenar as informações para leitura e uso pessoal no futuro.
Pacerier 17/08/11

Respostas:

9

Um bookmarklet é seu amigo ...

Crie um novo marcador de navegador e copie o código javascript abaixo para ele - quando quiser copiar um texto da wikipedia, basta clicar nele previamente e ele removerá todas as instâncias de [n] para atender aos seus requisitos na pergunta.

javascript:function a (){document.body.innerHTML=document.body.innerHTML.replace(/<sup\b[^>]*>(.*?)<\/sup>/gi, "" );return;}; a();

Nos bastidores, está apenas fazendo uma pesquisa de expressão regular e substituindo todas <sup>...</sup>as tags HTML na página.

Eu apenas tentei isso no IE7 e funciona bem, por isso espero que esteja bem em outros navegadores também.

Eu credito esse tópico SO por me apontar na direção certa - eu sabia que um bookmarklet era o caminho a seguir, mas nunca o havia escrito antes.

Stuart McLaughlin
fonte
1
+1, é a única maneira de pensar em fazer isso. Mesmo extensões adicionais do navegador teriam que usar algum tipo de análise Javascript para fazer isso (e de fato a maioria faz).
03