Quero procurar locais de trabalho em Alberta, Canadá. Uma maneira de proceder é fazer a pesquisa usual do Google por eles e, de alguma forma, percorrer os resultados dos domínios que parecem corresponder aos locais de trabalho.
Muitos deles virão dos principais sites de empregos, como monster.com ou Indeed.ca. Menos serão provenientes de sites menos conhecidos que ainda seriam do interesse dos candidatos a emprego. O que eu quero poder fazer é coletar domínios e subdomínios.
Por exemplo, e pensando procedimentalmente, depois de encontrar e observar o site monster.com, quero ignorar as ocorrências subsequentes dele. Quero continuar procurando novos domínios e subdomínios distintos. Alguma ideia?
Não encontrei uma maneira de fazer isso com nenhuma coleção de operadores do Google. Há algum jeito? Se isso não for possível, qual seria uma boa maneira de fazer isso?
fonte
Respostas:
Que tal relacionados: jobs.alberta.ca ?
fonte
Que tal algo como este site: ca jobs alberta ?
Ativar a Pesquisa Instantânea irá se livrar dos domínios redundantes (não há problema em pressionar enter e obter resultados mais refinados). Aqui estão os resultados da Pesquisa instantânea:
fonte
Não há uma maneira fácil de fazer isso usando a API XML do Google, pois não existe uma API que filtre os hits da maneira que você deseja. Isso não quer dizer que você não pode trazer de volta TODOS os hits e filtrá-los você mesmo. Se você adotar essa abordagem detalhada, gostaria de ver o que estava envolvido para que seu processo de filtro fosse executado no servidor deles.
fonte
Como várias respostas para outras tags [google-search] apontam, você pode remover sites via -site: monster.com. impedir muitos resultados do mesmo domínio na pesquisa do Google Você pode tentar procurar os domínios encontrando as páginas que contêm os substantivos mais adequados, em vez da similaridade e relevância básicas do Google para ver se alguém foi criado um diretório de lista para você já.
fonte