A empresa em que trabalho possui um sistema de gerenciamento de conteúdo que cria páginas automaticamente para determinado conteúdo.
Por exemplo, existe uma página em nosso sistema que tem a capacidade de mostrar informações sobre qualquer compositor em nosso banco de dados, dependendo dos parâmetros de entrada e das informações que temos sobre eles. No entanto, de vez em quando, há um compositor que não possui nenhuma informação; portanto, a página renderiza uma página em branco. Como podemos dizer ao Google para não indexar a página naquele momento, mas talvez em algum momento no futuro?
Como o conteúdo é gerado automaticamente, não podemos impedir que as páginas fiquem visíveis, pois as informações sobre esse compositor podem aparecer a qualquer momento.
Editar
Observe que nosso sistema CMS que realiza a busca é seriamente complicado e profundo. A parte do conteúdo da página retornará algum tipo de dados, portanto, executar um empty($content) ? xx : yy
conforme sugerido não é uma solução rápida. Se um compositor não existir, o sistema não terá uma página para o compositor; se o compositor existir, o sistema existirá. Quando a página desse compositor é renderizada, o sistema pesquisa todos os tipos referentes a compositores, como obras, para criar uma página dinâmica.
Respostas:
Se não houver conteúdo para um compositor específico, use a metatag:
Assim que o conteúdo for adicionado e a metatag for removida, o Google o indexará.
Exemplo:
fonte
Se as páginas "ausentes" realmente não contêm informações reais, mas são simplesmente espaços reservados para "pode haver uma página aqui no futuro", eu recomendaria configurar o servidor da Web para retornar o código de status 404 Não Encontrado .
Os navegadores ainda mostrarão essas páginas para o usuário, assim como mostram as páginas de erro 404 normais (pelo menos enquanto forem longas o suficiente ), mas os mecanismos de pesquisa simplesmente tratam a página como se ela não existisse.
Este é o método usado, por exemplo, na Wikipedia, para páginas inexistentes como esta . Uma de suas vantagens (além de ser, sem dúvida, semanticamente correta) é que garante que os mecanismos de pesquisa tratem essas páginas exatamente da mesma maneira que normalmente tratam as páginas ausentes que retornam um código de status 404.
Uma desvantagem potencial é que, se você tiver links para páginas que retornam um código de status 404, elas aparecerão como "erros 404", por exemplo, nas Ferramentas do Google para webmasters. No entanto, isso é perfeitamente normal, e não é algo para se preocupar .
Para ajudar ainda mais os mecanismos de pesquisa a descobrir suas novas páginas, quando eles obtêm algum conteúdo real e param de retornar 404s, você também deve manter um sitemap XML atualizado regularmente, listando todas as páginas do seu site que possuem conteúdo. Isso permite que o Google e outros mecanismos de pesquisa descubram novas páginas diretamente pelo mapa do site, em vez de precisar encontrá-las aleatoriamente enquanto rastreiam novamente o site.
Ps. Veja também: Não é página de índice que não possui conteúdo relevante?
fonte
Pessoalmente, eu criava uma mensagem no sistema que informava ao usuário que, embora sua solicitação fosse concluída, não foram encontrados compositores para os parâmetros fornecidos. Isso evitará que o usuário pense que a página / link está "corrompido".
fonte
Se a página não tiver conteúdo, seu sistema CMS não deverá estar vinculado a ela. Vincular a páginas em branco é ruim para usuários e mecanismos de pesquisa.
Gosto da sugestão de Wayne Whitty sobre como colocar a meta tag na própria página do compositor. Você deve encontrar uma maneira de fazer algo semelhante no local em que lista todos os compositores e vincula-os a eles:
Se você fizer isso, os mecanismos de pesquisa não encontrarão mais as páginas em branco para começar.
fonte