Estou procurando uma maneira de filtrar tabelas frequentemente encontradas em artigos da Wikipedia, para que eu possa comparar apenas as linhas (e colunas) nas quais estou interessado.
Existe também
- um recurso interno do mecanismo da Wikipedia que eu não conheço
- ou um plug-in de navegador que suporte esse
Os recursos em que consigo pensar são:
- Filtrar por valor da coluna
- Ocultar colunas
- Classificação multinível
wikipedia
mediawiki
greasemonkey
baiacu
fonte
fonte
Respostas:
Se você colocar essa fórmula em uma célula na Planilha do Google, ela raspará os dados tabulares deste link de artigo da Wikipedia: http://en.wikipedia.org/wiki/Demographics_of_India
Depois de ter os dados no Google Sheet, você pode filtrar por valor da coluna (selecione o cabeçalho da coluna, escolha Filtro no menu Dados ) e oculte a coluna (selecione a coluna, escolha Ocultar coluna no menu de contexto)
fonte
Mesas? Você quer dizer as infoboxes? Você provavelmente deve usar o Wikidata http://wikidata.org/w/api.php e extrair as informações de lá (será mais limpa), depois apresente-as como preferir.
Caso contrário, você poderá espalhar
display: none
em todos os lugares IDs e classes apropriadas para as tabelas em questão, mas será uma busca interminável de informações não estruturadas.fonte
O script Greasemonkey do filtro de tabela da Wikipedia faz o que você deseja:
Pode ser necessário adicionar a
https
versão do URL da wikiedia à lista de filtros de páginas incluídas no script para que ele funcione.fonte