Por que, na primeira página, o Google diz que existem milhares de resultados, mas na última página há menos de cem?

11

Por que, na primeira página, o Google diz que existem milhares de resultados, mas na última página há menos de cem?

Essa é uma espécie de Pesquisa Google recursiva que deve ser auto-explicativa. Levei algum tempo para ajustar a frase e tentar encontrar um número que correspondesse exatamente, a razão pela qual eu mudei para " centenas "! : P

Se você já usa o Google por tempo suficiente, certamente tropeça em situações semelhantes a essa, muitas vezes. Sempre que mostra menos de 10 páginas, é fácil vê-lo. O ponto é: o número de resultados em qualquer página, exceto a última, parece uma estimativa terrível .

O que é ainda mais estranho: em alguns momentos aleatórios, a estimativa se torna subitamente muito melhor e quase exatamente a mesma em todas as páginas do que na última página - a única página sempre correta.

Então, alguém sabe o porquê?

cregox
fonte
1
Agora em uma página para que procurar ele diz que 3200 resultados, mas na última página ele diz que 75 (para pessoas interessadas em uma atualização)
dkuntz2
@DKuntz são 2990 e 65 para mim (enquanto estou logado) e, se eu sair (que foi como fiz na primeira vez), ele se transforma em 3120 e 77. Talvez mais tarde eu mude um pouco a questão e construa criar uma consulta recursiva mais consistente - mas qualquer um também é bem-vindo! : P
cregox
Google é estranho.
Dkuntz2 01/05/19
O meu sempre diz 208 resultados na última página, sejam 4 páginas de resultados ou 22, mas sempre 208.
mchid 09/03
Veja também searchengineland.com/…
1110101001

Respostas:

6

Não sei a resposta exata - talvez ninguém fora do Google saiba. Mas tenho dois pontos de dados que podem ser úteis.

A primeira é a opinião do XKCD sobre o assunto:

Então, parece realmente que há um certo limite de volume de resultados além do qual o Google aparentemente diz "dane-se" e lança um número gigantesco. Eu imagino que isso provavelmente se deva à incompetência e não ao engano intencional; Tenho certeza de que é difícil gerar páginas rapidamente de várias fontes, e talvez para pesquisas com muitos resultados, elas não tenham tempo para sincronizar tudo. Então eles falsificam os números. O fato de isso parecer que eles têm muito mais resultados do que eles provavelmente é apenas um bônus não intencional.

O segundo dado é de um professor de ciência da computação que eu tinha, que estava bastante curioso sobre o assunto e incomodou alguns amigos do Google. Eles disseram a ele que, às vezes, fica muito caro descobrir quantos resultados foram realmente retornados de uma pesquisa; portanto, eles dão um palpite e retornam a primeira página de resultados, que é a principal preocupação das pessoas. Somente quando você começa a se aprofundar nas páginas, o Google se preocupa em calcular completamente as páginas restantes.

Portanto, nenhuma dessas é uma resposta definitiva, mas espero que sejam úteis para explicar os tipos de problemas que podem estar causando imprecisões do Google.

EDITAR:

A resposta de Sathya nesta página tem uma resposta do KB do webmaster do Google .

Quando você realiza uma pesquisa, os resultados geralmente são exibidos com as informações: Resultados 1 - 10 de cerca de XXXX.

O cálculo do Google do número total de resultados de pesquisa é uma estimativa. Entendemos que um valor aproximado é valioso e, ao fornecer uma estimativa e não uma conta exata, podemos retornar resultados de pesquisa de qualidade mais rapidamente.

Além disso, quando você clica na próxima página dos resultados da pesquisa, o número total de resultados da pesquisa pode mudar. Nesse caso, percebemos que alguns dos resultados da consulta são duplicados e os coletamos para que você possa encontrar o resultado específico que está procurando com mais facilidade. O recolhimento das duplicatas diminui o número estimado de resultados, bem como o número geral de páginas de resultados.

dsolimano
fonte
Enquanto eu amo XKCD e ex-professores Deary, o que você está me dizendo é que eu provavelmente deveria perguntar isso no stackoverflow.com: P
cregox
Acho que ninguém no stackoverflow terá uma resposta definitiva - se você realmente precisa saber, deve perguntar ao Google. Só posso transmitir a resposta de alguém que pediu ao Google há alguns meses atrás.
dsolimano
sem procurar uma resposta definitiva, apenas uma com uma explicação mais profunda e razoável, de preferência com boas fontes. Não me interpretem mal, é razoável, mas dizer "porque é difícil", mesmo que seja autoritário e faça sentido, é pouco para mim. Hmm ... talvez
skeptics.se
Boa edição, agora é uma boa fonte! Embora ainda esteja dizendo "porque é difícil", o que significa que ainda estou esperando por mais detalhes. : P
cregox
7

Não - o número é apenas uma aproximação .

Quando você realiza uma pesquisa, os resultados geralmente são exibidos com as informações: Resultados 1 - 10 de cerca de XXXX.

O cálculo do Google do número total de resultados de pesquisa é uma estimativa. Entendemos que um valor aproximado é valioso e, ao fornecer uma estimativa e não uma conta exata, podemos retornar resultados de pesquisa de qualidade mais rapidamente.

Além disso, quando você clica na próxima página dos resultados da pesquisa, o número total de resultados da pesquisa pode mudar. Nesse caso, percebemos que alguns dos resultados da consulta são duplicados e os coletamos para que você possa encontrar o resultado específico que está procurando com mais facilidade. O recolhimento das duplicatas diminui o número estimado de resultados, bem como o número geral de páginas de resultados.

Sathyajith Bhat
fonte
Penso que este não é um bom comportamento se eles sempre limitarem o número de resultados a mais ou menos 1000 apenas. Caso o usuário queira mais, ele deve mostrar mais. Do meu ponto de vista, algumas palavras-chave comuns devem retornar uma quantidade realmente grande de resultados de pesquisa (como flores, livros ...) e acho que existem muitas imagens diferentes na Internet!
@ user11656, você supõe que a Pesquisa de imagens do Google funcione da mesma maneira que uma pesquisa em um aplicativo padrão que você pode usar. As coisas normalmente funcionam de maneira muito diferente nessa escala. Provavelmente, não há uma resposta única para "todas as imagens que correspondem a flores", pois um servidor na Austrália pode ter uma imagem carregada recentemente que ainda não foi propagada para o servidor nos EUA. Então você tem que lidar com coisas como apresentar duplicatas e como fazer tudo isso através de milhões de imagens para milhões de usuários instantaneamente. É difícil e você precisa fazer compromissos arquitetônicos.
George Mauer
2

Nenhuma das respostas acima está correta.

A estimativa do Google deve estar mais próxima do número real de resultados do que o fornecido.

Isso pode ser mostrado por um exemplo simples. Escolha uma palavra um tanto frequente como "Rússia" ou "Michael". Na verdade, deve haver milhares, se não centenas, de sites na Internet que contenham essas palavras em algum lugar do site. Mas os resultados do Google podem fornecer apenas, digamos, 700.

A verdade não é que o Google faça grandes superestimativas, mas que agora o Google limita bastante o número de resultados que ele fornecerá. Reduz severamente os resultados, em nosso maior prejuízo como indivíduos. É lamentável, porque eu quero ler os milhares de sites com meus termos em alguns casos.

Sei disso porque uso o Google há muito tempo, talvez 10 a 15 anos e percebi que, como regra geral, os resultados dos termos ficaram mais curtos, não mais, mesmo que o número de sites com os mesmos termos geralmente deva aumentaram no tempo em que uso o Google.

Enquanto no passado, anos atrás, eu poderia obter talvez 1000 resultados para alguns termos, agora estou obtendo 500 resultados para os mesmos termos pelos quais obteria 1000 resultados.

Rakovsky
fonte
2
Observe que "acima" não tem contexto nas respostas, pois elas podem ser classificadas de várias maneiras diferentes. Mesmo se você assumir a classificação padrão por "votos", suas posições serão alteradas à medida que os votos para cima e para baixo forem adicionados.
ale
Muito interessante! No momento, a Rússia me fornece apenas 322 resultados, e isso só aparece na 34ª página . Até então, seriam 799.000.000 resultados! Embora esse seja um bom insight, ainda não parece certo. Eu também não acho que as primeiras estimativas estejam corretas e a intenção está trazendo apenas resultados que são mostrados, não "quantos ele acha que existem na Web"; portanto, a última página foi corrigida.
cregox 9/09/15
1

O problema com o mecanismo de pesquisa do Google (imagem) é que ele busca relevância, diminuindo a variação. Em primeiro lugar, é importante entender como funciona. Uma imagem carregada na Internet precisa ser indexada de duas maneiras:

  • com base na originalidade (a imagem é analisada por um "bot inteligente" com base na cor, tamanho, padrões, reconhecimento de forma, tipo etc.)
  • com base na semelhança (a imagem é analisada por um "bot2 inteligente" e é referenciada com imagens já existentes em um banco de dados e mais marcadas com um ou dois rótulos de categoria: "image is match" e "image is similar to ... ")

Após a indexação, a imagem herdará "palavras-chave" como resultado do reconhecimento para evitar a exibição de resultados fora do tópico para o usuário final. O fato é que cada palavra-chave é uma frase autônoma com valor atribuído em% com base na força da relevância (é por isso que agrupar mais palavras na caixa de pesquisa resulta em menos resultados e também quando você pesquisa uma imagem carregando-a ou inserindo URL, Google atribuirá um "palpite" com apenas as principais palavras-chave, o que significa que a pesquisa nunca mostrará todas as imagens simplesmente porque a pesquisa não foi projetada para isso)

Portanto, no final de um dia, quando você realiza uma pesquisa de imagens e logo abaixo da caixa de pesquisa, você vê um número tremendo dizendo "25.270.000.000 resultados (0,55 segundos)", que geralmente é sempre um número falso, porque você não terá mais de 200 (no máximo 500, mas somente depois que o usuário solicita) resultados que também são filtrados para excluir:

  • duplicatas externas (se a mesma imagem tiver mais de 2 vezes na mesma página do site)
  • duplicatas de relevância (mostra apenas "melhores resultados" - veja a imagem abaixo)
  • imagens com problemas legais (veja a imagem abaixo)
  • imagens que violam o DMCA (veja a imagem abaixo)
  • imagens originárias de fontes SPAM, MALWARE, PHISHING
  • imagens ocultas (se um usuário não desativou a Pesquisa segura)
  • imagens que estão na lista negra do Google ( artigo )
  • imagens com AR diferente (basicamente todas as imagens com uma proporção diferente da referência de pesquisa de imagens. por exemplo, você pode perder todos os resultados desejados se pesquisar pela imagem escolhida - digamos, com uma proporção estranha 9: 7 - enquanto todas as imagens são indexadas O Google possui a proporção 3: 4 - que talvez seja a maior desvantagem desse mecanismo de pesquisa, porque sempre obedece ao formato como o primeiro critério)
  • e um monte de mais

Para resumir: os resultados da pesquisa de uma imagem nunca são totalmente relevantes. Às vezes, você obtém o resultado final desejado com uma frase de pesquisa "cartaz do portão", caso contrário, poderia ser "capa do portão", "desfoque de portão", "dvd do portão", "portão de 2015" ou mesmo "自衛隊 彼 の 地 に て 斯 く 戦え り "- você simplesmente não pode obter os resultados da imagem" ALL ", porque não há nada que seja" ALL "; é por isso que é necessário brincar com ela para chegar lá. E também é relevante mencionar que existem outros mecanismos de pesquisa de imagens que podem fazer o trabalho de uma maneira mais diferente, porque funcionam com diferentes padrões e critérios. Não é e nunca foi o "Google" apenas ... >> https://www.yandex.com/images/

extensões notáveis:

user0
fonte
Mais uma vez, marcá-los como duplicados seria muito mais útil do que postar a resposta em cada pergunta.
jonsca
0

No topo, aparece a página 70 de 7000 resultados (exemplo). Fornecerá o número da página e quantos resultados. Não há 70 resultados, mas 70 páginas. Espero que isto ajude.

Aaron Ford
fonte