Existe uma maneira de pesquisar no Google usando expressões regulares (regex)?

60

Seria muito útil se o Google fornecesse uma pesquisa por expressão regular .

Existe uma maneira de fazer isso?

(OBS: Eu não estou falando sobre expressões falsas regulares, como site:, filetype:, AND, ORou "Text". Eu gostaria de pesquisar com uma expressão regular como .+[]^).

Por exemplo, existe um aplicativo, um site ou uma ferramenta do Google para pesquisar coisas como *.stackexchange?

GarouDan
fonte

Respostas:

24

Esse recurso não está disponível na Pesquisa clássica do Google e não está no roteiro do Google. Você pode aprender mais sobre este tópico assistindo ao vídeo do Google O Google implementará a capacidade de pesquisar com expressões regulares?

No entanto, há uma exceção. A Pesquisa de código do Google suporta expressões regulares. Obviamente, o destino da pesquisa para este mecanismo de pesquisa de tópicos é reduzido apenas ao código-fonte.

Vale ressaltar que algumas palavras-chave de pesquisa do Google podem substituir parcialmente expressões regulares. Por exemplo, se você quiser pesquisar qualquer variação de duas palavras de "TERM de pesquisa", poderá usar o operador curinga.

search *

encontrará resultados para pesquisa e qualquer outra (uma) palavra. Costumo usá-lo para verificar regras ou sinônimos básicos da gramática inglesa (por exemplo, "tão fácil quanto *" ).

Simone Carletti
fonte
2
Google Code Search não existe mais , mas pode haver alternativas (não que ele é relevante para esta pergunta)
musefan
Agora, esta resposta está um pouco desatualizada: veja esta resposta, por exemplo, nas pesquisas de expressões regulares do Google.
Anderson Green
11

A Pesquisa do Google pode retornar as correspondências de algumas expressões regulares simples. Por exemplo, a consulta de pesquisa

"(gray|red) (wolf|fox)"

parece ser equivalente a

("gray wolf" OR "red fox" OR "red wolf" OR "gray fox")

Você pode ver a saída desta consulta de pesquisa aqui .

Anderson Green
fonte
Estou procurando um medicamento ou nome químico. Eu posso ler "heme? Llnate" - onde os pontos de interrogação são ilegíveis. O Google não pode ajudar.
SDsolar
7

O SymbolHound possui uma pesquisa de repositório de código- fonte aberto , semelhante à opção de pesquisa de código do Google, agora descontinuada, além de uma pesquisa na Web com símbolos que indexa sites relacionados à programação, como o Stackoverflow.

Tom
fonte
11
Se você é afiliado à SymbolHound, você pode indicar isso em seu perfil. Obrigado!
Codingbadger
5

Você pode escrever um software para:

  1. Pegue as palavras-chave da expressão regular;
  2. Pesquise no Google as palavras-chave e obtenha uma lista de resultados;
  3. Rastreie cada URI resultante e filtre-o com expressão regular completa.

Vamos estudar um caso: site:gog.comencontre todos os jogos com dublagem em espanhol.

A expressão regular é:

Audio[^:]*:[^.,]*Spanish

Deve corresponder, por exemplo:

Audio lanuage: English, German, Spanish, French.

E não corresponde:

Audio language: only-English. Text language: Spanish.

Etapa 1. Deixe seu software pesquisar isso no Google:

site:gog.com audio Spanish inurl:game

inurl:game aqui significa apenas pesquisar nas páginas de descrição do jogo

Etapa 2. Obtenha os 300 links resultantes e entre em cada um deles.

Etapa 3. Filtre o resultado com a expressão regular fornecida:

Audio[^:]*:[^.,]*Spanish

Isso deve ser fácil de construir. Na verdade, não entendo por que não consegui encontrar algo que já foi construído dessa maneira.

Como os mecanismos de pesquisa não podem dispor do recurso para digitalizar seus dados com expressão regular, esse trabalho sujo é da sua parte, e seu computador deve fazer isso com o que os mecanismos de pesquisa já fornecem.

Tankman 六四
fonte
+1. Muito obrigado. Esta é uma ideia muito interessante, de fato. O principal problema é que provavelmente precisaremos de clusters de alto desempenho para fazer algo realmente interessante.
GarouDan
Estou escrevendo esta extensão agora.
Navin
4

Não, infelizmente não :(. Em teoria, você poderia criar seu próprio mecanismo de pesquisa e fazê-lo, mas isso seria bem difícil.

bob invisível
fonte
1

Apenas para referência, a ajuda do Google nos operadores de pesquisa está aqui .

Curiosamente, "-" ainda é um operador para exclusão de palavras, mas eles removeram "+" como operador, usado no passado para exigir um determinado termo de pesquisa. Aparentemente, "O operador + foi aposentado quando o Google+ foi iniciado, porque + era necessário como um personagem pesquisável em vez de um operador." ( Https://support.google.com/websearch/answer/2466433 )

ludinom
fonte
0

Você pode começar com uma pesquisa detalhada do Google para selecionar o texto de destino a ser pesquisado. Em seguida, abra, digamos, os 50 principais resultados em várias guias e use o complemento "Fastest Search" do mingyi para pesquisar os resultados usando uma expressão regular.

user60402
fonte
-3

Se você conhece o VBA, pode escrever um código para obter dados da Web para o Excel. Eu corro o programa dia e noite e posso obter milhões de resultados. Depois disso, você pode filtrar a partir desses resultados.

Nguyen Kieng Hiep
fonte
2
oh, deus ... perdoar os pecados
beppe9000