O site em que estou trabalhando possui algumas centenas de PDFs. Acho que nunca vi nenhum deles voltar em uma pesquisa, mas existem links diretamente do site externo. Eles também estão cheios de palavras-chave porque são documentos do produto.
Há algo de especial que precisamos fazer para que o Google ou outros mecanismos de pesquisa os rastreiem?
Existem regras rígidas e rápidas para criar PDFs para ajudar o Google a gostar mais deles? Por exemplo, devo executá-los no ghostscript para limpar as tags PDF quebradas que a Adobe cria durante a geração?
Respostas:
O Google definitivamente indexa arquivos PDF e você pode pesquisar apenas arquivos PDF adicionando
filetype:pdf
à sua consulta de pesquisa ( exemplo ).Eu diria que as principais coisas a serem feitas para otimizar um PDF para que ele seja facilmente indexado seriam:
Para obter mais dicas, leia Otimizando documentos PDF e Onze dicas para otimizar PDFs para mecanismos de pesquisa
fonte
Não tenho certeza sobre outros mecanismos de pesquisa, mas, no que diz respeito ao Google, a regra principal seria não excluí-los via robots.txt
Este foi o anúncio inicial de suporte à pesquisa em PDF.
fonte
Assim como tornar um site compatível não pode prejudicar seu SEO, tornar seu PDF acessível não prejudica. O verificador de acessibilidade incorporado da Adobe está longe de ser perfeito, mas pelo menos a correção dessas áreas o ajudará a começar.
Eu provavelmente gasto 5 minutos em cada 4 ou 5, principalmente PDFs de texto que colocamos online. O tempo aumenta igualmente, dependendo do número de páginas e da complexidade dessas páginas.
Supondo que você tenha o Adobe Acrobat Pro para fazer sua edição:
Para uma edição mais avançada, como tabelas, e erros realmente estranhos da Adobe, usamos um plug-in chamado CommonLook. O CommonLook faz o trabalho, mas eu odeio quase tanto quanto odeio as ferramentas da Adobe.
Familiarize-se com a ferramenta Retocar ordem de leitura, a barra de ferramentas Tags, a barra de ferramentas Ordem de leitura e a barra de ferramentas Conteúdo. Meu trabalho exige documentos totalmente compatíveis antes de sair para a Web, mas qualquer um pode se beneficiar de algumas propriedades simples de marcação e documento.
fonte