É uma má ideia usar a Pesquisa Google no seu site?

11

Se você tem um aplicativo da Web com muitos registros, é uma má idéia usar a Pesquisa Google no seu site? Em vez de escrever uma função de pesquisa e lidar com problemas de desempenho, você terceiriza o recurso de pesquisa para o Google.

John Doe
fonte
1
Isso me leva à minha curiosidade. Você poderia fornecer mais detalhes à pergunta? porque você acha que isso pode ser uma má ideia? você tem mais documentação fará com que você pense que é uma má ideia? Você leu algo que fez você pensar que conseguiu isso?
usar o seguinte comando
Olá, @RTOSkit, desenvolvi alguns aplicativos da Web pequenos e a funcionalidade de pesquisa ainda permanece um dos maiores desafios. Tenho que levar em consideração a precisão do resultado da pesquisa e o desempenho do servidor. Pessoalmente, não acho que seja uma idéia tão ruim, mas um tanto "estranha", pois é a única parte do aplicativo que não é desenvolvida por você.
John Doe
Ok, entendo, o @ JCL1178 ofereceu uma resposta ideal.
usar o seguinte comando

Respostas:

3

Como JCL1178 mencionado na resposta, o Google retornará apenas resultados para o que foi indexado. Isso não significa apenas que alguns dos seus resultados talvez nunca apareçam, mas se o seu site alguma vez for des indexado por algum motivo, você perderá a pesquisa no seu site. Ter algo tão importante quanto a pesquisa depender de um serviço de terceiros não suportado é perigoso.

Como você tem acesso direto aos dados, é possível fornecer uma pesquisa muito melhor e mais refinada do que o Google ou qualquer outro mecanismo de pesquisa. Você pode permitir que seus usuários pesquisem campos específicos, filtrando outros hits de campos não relacionados. O Google não tem contexto para os valores que está pesquisando, portanto, uma pesquisa pela família "Smith" pode trazer resultados para as pessoas que moram na "Smith St." ou alguém com a ocupação de "ferreiro".

A maioria dos bancos de dados relacionais populares vem com a capacidade de fazer pesquisas de texto completo; portanto, adicionar um recurso básico de pesquisa pode ser tão simples quanto escrever algumas instruções SQL.

Uso os Mecanismos de pesquisa personalizados do Google para pesquisas gerais em meus sites, mas não os utilizo para pesquisar informações armazenadas em um banco de dados, a menos que minha capacidade de fazer pesquisas de texto completo seja limitada (limitações de software, problemas de desempenho devido a hardware / tamanho do conjunto de dados). Depende da complexidade dos dados e da importância da pesquisa na navegação dos dados ... mas fornecer suas próprias instalações de pesquisa parece ser a aposta mais segura para mim.

Jacob Hume
fonte
Todos os pontos muito bons e pulei totalmente a possibilidade de desindexar na minha resposta.
JCL1178
Olá @Jacob Hume. Ótimo ponto sobre confiar em serviços de terceiros. Isso era o que eu tinha em mente também. Eu experimentei pesquisas de texto completo e também vários mecanismos de pesquisa, mas como mencionei em um dos meus comentários, sempre tenho problemas com a precisão dos resultados e / ou o desempenho do servidor. Mais uma vez, muito obrigado pela sua contribuição.
John Doe
3
Portanto, em vez de ter uma chance de 0,00001% de pesquisa sendo reduzida (é provável que o Google não desd indexe seu site a menos que você faça algo realmente estúpido), você está propondo que o site tenha uma implementação de pesquisa de texto completo ingênua 100% do tempo? Não é um bom compromisso da OMI. A pesquisa de texto completo é um recurso muito útil para acessar rapidamente a funcionalidade básica de pesquisa, mas a criação de um recurso de pesquisa útil, muito menos um tão amigável quanto o do Google, é um pouco mais complicado do que apenas "escrever algumas instruções SQL".
Lèse majesté
2
Mecanismos de busca reais como Google, Solr, Lucene, Sphinx, etc. são capazes de fazer coisas como pesar proximidade de palavras-chave, pesquisas de substring, distância levenshtein / metafone / busca de texto / busca difusa de texto, etc., que melhoram muito a usabilidade. A pesquisa de texto completo é um bom ponto de partida, mas na verdade é preciso muito mais trabalho para criar um recurso de pesquisa decente que possa retornar consistentemente resultados relevantes. A maioria dos desenvolvedores que não são especialistas em desenvolvimento de mecanismos de pesquisa faria bem em usar um serviço de terceiros ou pelo menos uma solução comercial comprovada como Lucene ou Solr.
Lèse majesté
2
Até grandes empresas como a Oracle lutam para criar pesquisas úteis em todo o site internamente (compare a pesquisa de documentação do MySQL.com antes e depois da aquisição da Oracle). Além disso, sua caracterização do mecanismo de pesquisa do Google é mais apropriada para a pesquisa de texto completo do que o mecanismo de pesquisa do Google, que na verdade usa provavelmente os heurísticos mais avançados e os algoritmos de previsão de intenção do usuário do setor.
Lèse majesté
7

Para os fins desta resposta, suponho que você esteja falando sobre a Pesquisa personalizada do Google / Pesquisa no site e não o Google Search Appliance, o que seria uma idéia MUITO boa, embora cara.

Terceirizar sua pesquisa para a Pesquisa personalizada do Google não é uma má idéia, mas pode não ser a melhor opção para o seu site / modelo de negócios / o que for devido às limitações e regras do Google.

A Pesquisa personalizada é essencialmente a mesma coisa que digitar search terms site: yoursite.comno Google, exceto que você não precisa especificar a site: yoursite.comparte e pode incorporar um formulário de pesquisa no seu site. A Pesquisa de sites é uma versão não gratuita da Pesquisa personalizada, com mais opções de personalização e algum acesso à API. Existem outras diferenças entre a Pesquisa personalizada / site e o uso adequado do Google, explicadas na documentação vinculada, mas o importante a ser observado é que elas funcionam apenas com o que o Google pode ver.

Portanto, os "muitos registros" no seu aplicativo da web precisam ser totalmente capazes de serem descobertos pelo Google para que a Pesquisa personalizada realmente retorne resultados precisos. Se você limitar / proteger os registros da visualização pública por qualquer motivo, precisará mostrar ao Google os mesmos resultados limitados que um usuário desconectado veria ou poderá indexar o conteúdo completo do Google, mas deverá seguir as regras do Primeiro clique gratuito ou corre o risco de ser comido por um Panda zangado. Se você apresentar uma coisa ao Google e outra aos visitantes, isso é Cloaking e você gerará uma penalidade no seu site. Se todos os registros que você deseja incluir nos resultados da pesquisa não puderem ser localizados por qualquer motivo, usar a Pesquisa personalizada do Google ou a Pesquisa no site não é uma boa ideia para o seu modelo específico.

Mas se você pode permitir que tudo seja indexado, não se importa como o Google retorna os resultados da pesquisa para a Pesquisa personalizada (ou não está disposto a pagar pela pesquisa no site para corrigir isso) e está disposto a arriscar que uma página crítica não seja indexada por qualquer motivo, você pode e deve considerar seriamente.

JCL1178
fonte
1

Eu sugiro que você use a Pesquisa do Google, se quiser que todos os dados do seu site sejam vistos por outras pessoas também. Isso economizará um pouco mais de codificação.

Se for um sistema fechado e você não desejar que outras pessoas vejam os dados, obtenha seu próprio sistema de pesquisa.

Sidh
fonte