Imagens codificadas em Base64 e disponibilidade de seus metadados para o Googlebot
9
Se eu incorporar uma imagem a uma página como um img- srccom URI de dados base64, os metadados da imagem (EXIF, IPTC, XMP) ainda estão disponíveis para o imagebot do Google?
Provavelmente não. O Googlebot provavelmente precisa de um URL para classificar e indicar usuários.
John Conde
11
Esqueça os dados EXIF, nem tenho certeza de que as imagens do Google indexariam uma imagem que não possui seu próprio URL.
Stephen Ostermiller
@StephenOstermiller: eis a questão: se indexar essas imagens, também será exibido EXIF #
Evgeniy
@ Evgeniy Como Stephen aponta, os URIs de dados não são separados do documento que os contém (veja isso para mais). Os mecanismos de pesquisa indexam URLs, para que apenas o documento que o contém seja indexado e se eles indexem os metadados contidos em um URI de dados (se é que também continha isso, tornando-o ainda maior) é um ponto mudo. Para confirmação, você pode usar um mecanismo de pesquisa de código-fonte para procurar um URI de dados e verificar se essa imagem foi indexada e continha informações EXIF no Google. Isso parece altamente improvável.
dan
@ Evgeniy Observe que a postagem cruzada da mesma pergunta em mais de um site do Stack Exchange não é tolerada.
dan
Respostas:
6
O Google não indexa imagens de URI de dados para a pesquisa de imagens do Google. John Mueller, do Google, diz isso aqui e nos comentários abaixo. Como as imagens URI de dados não são indexadas na pesquisa de imagens do Google, os dados EXIF nelas são irrelevantes.
Você pode verificar se essas imagens não estão indexadas. Eu pesquisei imagens do Google por "data uri" e verifiquei os resultados no local. Todas as imagens que eu vi foram arquivos de imagem, não URI de imagem codificado em base64. Você pensaria que, se o Google conseguisse indexar imagens de URI de dados, algumas delas apareceriam nos resultados de pesquisa para esse termo.
Se o Google decidir indexar imagens de URI de dados, ele poderá obter os dados EXIF. Uri de dados é o arquivo inteiro base64 codificado (sem espaços ou novas linhas) com um . Qualquer metadado no arquivo ainda estaria presente na versão do URI de dados codificados em base64.
Uso imagens de URI de dados em um dos meus sites. Faço isso porque os usuários normalmente apenas visualizam uma página no site para obter todas as informações necessárias. A inclusão de todos os dados de CSS, JS e de imagem embutidos na página melhora significativamente o desempenho. As imagens são todas pequenas, então a técnica funciona particularmente bem.
Meu site recebe uma quantidade razoável de tráfego do Internet Explorer 7 e versões anteriores, que não suportam imagens de URI de dados. Portanto, eu tenho que servi-los condicionalmente. Também tenho as imagens no servidor e escolho URLs regulares de imagem ou o URI de dados com base no User-Agentcabeçalho. Trato bots (incluindo o Googlebot) da mesma forma que o IE 7, ou seja, sirvo as imagens como URLs HTTP. Eu faço isso porque incluir imagens de uri de dados aumenta drasticamente o tamanho da página. A maioria dos bots não precisa baixar as imagens, por isso é mais eficiente para eles. Eu também havia notado que as Ferramentas do Google para webmasters relataram que o Googlebot estava rastreando meu site muito mais lentamente com as imagens de URI de dados ativadas para ele. Tecnicamente, isso pode ser considerado um disfarce, mas seria uma maneira de indexar suas imagens de URI de dados.
A sequência codificada @StephenOstermiller pode conter espaços: goo.gl/RF8r07 . vou preencher uma imagem com EXIF, codificá-la, publicar e procurar, se ela entra no índice.
Evgeniy
3
John Mueller (do Google) indica aqui que o Google geralmente não indexa imagens de URIs de dados. Muitas ferramentas online usadas para codificá-las também eliminam os metadados, por isso depende realmente de como são codificadas para saber se as informações EXIF são mantidas ... mas, como elas não são indexadas de qualquer maneira, é um ponto discutível. Informe seus resultados (lembre-se de não deixar o URL da imagem ser indexado - o Google também usa reconhecimento de imagem para que informações EXIF possam ser usadas a partir de imagens correspondentes).
dan
11
@dan obrigado! seu link para a resposta de John Muellers limpa muitas coisas agora de uma vez! Se G não indexa imagens, onde não é possível obter um URI, não é necessário considerar se o EXIF é deixado dentro ou não.
Evgeniy 23/09
3
Conforme vinculado acima, atualmente não os indexamos como imagens separadamente. Isso pode mudar no futuro, mas pelo menos no momento você deseja usar URLs de imagem separados se desejar que essas imagens sejam indexadas na Pesquisa de imagens.
John Mueller
2
Embora o Google use imagens como URIs de dados codificados em base64 em seu próprio SERP, ele não indexa essas imagens em outros sites. Obrigado a @dan, que me indicou a discussão dos Grupos do Google, onde John Mueller explica esse problema . Significa também que a pergunta sobre a existência de dados EXIF nessas imagens não é relevante.
Essa explicação deixa claro para quais imagens é melhor aplicar esta técnica de otimização de desempenho: imagens pequenas, como ícones, ícones e botões e aquelas imagens que não agregam valor adicional ao conteúdo do site.
No outro site, se for necessário incorporar uma imagem com valor de conteúdo adicional como URI de dados codificados em base64, a única prática recomendada para fornecer os metadados da imagem é usar a marcação do Schema.org, onde é possível negociar dados EXIF, por exemplo, com este tipo de marcação.
Outro tipo promissor de marcação para negociar dados parecidos com "property: value", como EXIF, possui no momento um status de proposta. Mas este artigo do blog do Google mostra trechos estruturados, que podem ser gerados pela proposta de marcação que eu vinculei acima.
Respostas:
O Google não indexa imagens de URI de dados para a pesquisa de imagens do Google. John Mueller, do Google, diz isso aqui e nos comentários abaixo. Como as imagens URI de dados não são indexadas na pesquisa de imagens do Google, os dados EXIF nelas são irrelevantes.
Você pode verificar se essas imagens não estão indexadas. Eu pesquisei imagens do Google por "data uri" e verifiquei os resultados no local. Todas as imagens que eu vi foram arquivos de imagem, não URI de imagem codificado em base64. Você pensaria que, se o Google conseguisse indexar imagens de URI de dados, algumas delas apareceriam nos resultados de pesquisa para esse termo.
Se o Google decidir indexar imagens de URI de dados, ele poderá obter os dados EXIF. Uri de dados é o arquivo inteiro base64 codificado (sem espaços ou novas linhas) com um
data:image/png;base64,
prefixo. Qualquer metadado no arquivo ainda estaria presente na versão do URI de dados codificados em base64.Uso imagens de URI de dados em um dos meus sites. Faço isso porque os usuários normalmente apenas visualizam uma página no site para obter todas as informações necessárias. A inclusão de todos os dados de CSS, JS e de imagem embutidos na página melhora significativamente o desempenho. As imagens são todas pequenas, então a técnica funciona particularmente bem.
Meu site recebe uma quantidade razoável de tráfego do Internet Explorer 7 e versões anteriores, que não suportam imagens de URI de dados. Portanto, eu tenho que servi-los condicionalmente. Também tenho as imagens no servidor e escolho URLs regulares de imagem ou o URI de dados com base no
User-Agent
cabeçalho. Trato bots (incluindo o Googlebot) da mesma forma que o IE 7, ou seja, sirvo as imagens como URLs HTTP. Eu faço isso porque incluir imagens de uri de dados aumenta drasticamente o tamanho da página. A maioria dos bots não precisa baixar as imagens, por isso é mais eficiente para eles. Eu também havia notado que as Ferramentas do Google para webmasters relataram que o Googlebot estava rastreando meu site muito mais lentamente com as imagens de URI de dados ativadas para ele. Tecnicamente, isso pode ser considerado um disfarce, mas seria uma maneira de indexar suas imagens de URI de dados.fonte
Embora o Google use imagens como URIs de dados codificados em base64 em seu próprio SERP, ele não indexa essas imagens em outros sites. Obrigado a @dan, que me indicou a discussão dos Grupos do Google, onde John Mueller explica esse problema . Significa também que a pergunta sobre a existência de dados EXIF nessas imagens não é relevante.
Essa explicação deixa claro para quais imagens é melhor aplicar esta técnica de otimização de desempenho: imagens pequenas, como ícones, ícones e botões e aquelas imagens que não agregam valor adicional ao conteúdo do site.
No outro site, se for necessário incorporar uma imagem com valor de conteúdo adicional como URI de dados codificados em base64, a única prática recomendada para fornecer os metadados da imagem é usar a marcação do Schema.org, onde é possível negociar dados EXIF, por exemplo, com este tipo de marcação.
Outro tipo promissor de marcação para negociar dados parecidos com "property: value", como EXIF, possui no momento um status de proposta. Mas este artigo do blog do Google mostra trechos estruturados, que podem ser gerados pela proposta de marcação que eu vinculei acima.
fonte