Descubra quando uma frase foi adicionada a uma página da Wikipedia

9

Existe alguma maneira de descobrir quando uma palavra ou frase específica foi adicionada a uma página da Wikipedia? Quero encontrar uma maneira de obter a primeira página que contém uma correspondência de uma frase específica (por exemplo, a primeira ocorrência <ref>webapps.stackexchange.com</ref>no histórico de revisões de uma página). (Pesquisar manualmente o histórico de revisões de uma página seria extremamente tedioso, por isso vou precisar de algum tipo de solução automatizada.)

Anderson Green
fonte
Esta questão é relevante (mas parece estar a discutir um assunto um pouco diferente, e requer algum conhecimento de sistemas de controle de revisão): webapps.stackexchange.com/questions/15938/...
Anderson Verde
Para ajudar as pessoas a encontrarem isso no google: quando uma palavra foi adicionada a uma página da Wikipedia?
fNek
@fNek Veja a resposta abaixo: você pode usar o WikiBlame para descobrir quando uma palavra ou frase foi adicionada a uma página.
Anderson Green

Respostas:

7

Existe uma ferramenta chamada WikiBlame que permite fazer exatamente isso: você insere um nome de página e uma frase para pesquisar e direciona você para a edição que a adicionou.

Ele também está vinculado na página Histórico de todas as páginas da Wikipedia em inglês (como "Pesquisa no histórico de revisões").

svick
fonte
Na página de resultados da pesquisa, a primeira ocorrência da frase de pesquisa é encontrada ao lado de "Inserção encontrada entre". Você pode pesquisar em todo o histórico de revisões digitando um número grande no campo "Revisões para verificar" (por exemplo, 10000.) Para pesquisar exclusivamente por wikitext, selecione "forçar a pesquisa por wikitext".
Anderson Green
Aqui está um exemplo específico de uma pesquisa (para a frase "jogabilidade principal" no artigo "Minecraft"): wikipedia.ramselehof.de/…
Anderson Green
1

A Wikimedia fornece um despejo XML do histórico completo de revisões de todos os artigos da Wikipedia. Este conjunto de dados contém uma versão desses dados a partir de abril de 2010. Este conjunto de dados não contém o texto completo das revisões, mas apenas as metad informações sobre as revisões, incluindo itens como idioma, registro de data e hora, artigo e similares.

Em todas as páginas, no canto superior direito, há um Historybotão que leva você ao histórico de revisões dessa página.

insira a descrição da imagem aqui

Fonte: História de Revisão da Wikipedia

abhshkdz
fonte
Como você pode obter um despejo XML do histórico de revisões para uma página específica?
Anderson Green
Veja a edição. É isso que você estava procurando?
abhshkdz
Eu preferiria algum tipo de solução automatizada, em vez de percorrer todas as revisões manualmente para encontrar uma sequência específica. É possível encontrar a primeira ocorrência de uma frase no histórico de revisões (sem pesquisar manualmente, o que pode levar horas)?
Anderson Green
11
Usar o dump XML é um exagero: você realmente não precisa fazer o download do histórico completo de revisões de todos os artigos da Wikipedia apenas para pesquisar o histórico de um artigo.
svick
Obviamente. Eu estava apenas dando todas as informações disponíveis.
abhshkdz