Faz sentido retornar um 410 em vez de 404 quando alguma página foi removida permanentemente?

16

Faz sentido retornar um em 410vez de 404quando alguma página foi removida permanentemente? Em este vídeo , Matt Cutts diz que o Google os trata da mesma, mas há outras razões para implementar um 410(exceto para correção técnica)?

Grande cego
fonte
Eu mesmo me perguntei sobre isso. Parece que o 410 simplesmente não é mais usado em lugar nenhum.
Wogsland 3/03

Respostas:

7

Em nosso site, implementamos recentemente 410 erros em páginas que foram removidas permanentemente. Temos cerca de 40 milhões de páginas no índice do Google e somos rastreados com 2 milhões de solicitações por dia pelo Googlebot.

Após limpar nosso banco de dados, encontramos um grande número de 404 erros aparecendo nos Erros de rastreamento nas Ferramentas para webmasters. Quando passamos para 410 status, em vez de 404, o número de erros por dia diminui pela metade, enquanto o número total de solicitações feitas permanece o mesmo. Portanto, essas páginas são rastreadas com mais êxito por dia no final. Parece que as páginas com status 404 são rastreadas várias vezes antes de serem totalmente removidas do índice.

Então, eu diria que sim, definitivamente vale a pena usar 410, quando apropriado, a fim de manter seu orçamento de rastreamento do Google.

stefan verhoeff
fonte
11

Há mais do que o Google neste mundo. Um 410 informa inequivocamente a um bot que o arquivo se foi. Um 404 não. Um bot persistente pode continuar tentando encontrar um 404 indefinidamente, enquanto pode parar de tentar encontrar um 410 imediatamente, o que deixaria seu servidor muito feliz.

John Conde
fonte
2
Ele vai nos dois sentidos, no entanto: um bot realmente de baixa qualidade só poderia reconhecer 200 e 404.
Peter Taylor
4
@ Peter não tem certeza do que importa - se eles são ruins e não entendem os códigos HTTP, que mal faria? Se você usar 404, os bots ruins e bons continuarão solicitando a página, enquanto que com 410 apenas o ruim será.
DiscruntledGoat
1
O que o @DisgruntledGoat disse. Veja a Lei de Postel . Implementações de baixa qualidade simplesmente não podem ser consideradas; o que você vai fazer, tentar explicar todos eles e cada uma de suas peculiaridades, tudo ao mesmo tempo? Existem raras exceções, como, por exemplo, o domínio de longa data do navegador IE6, mas em geral isso simplesmente não vale a pena.
Su '
6

Além de haver mais mecanismos de pesquisa do que o Google por aí, também não há razão para supor que o Google nunca mude a maneira como eles tratam 410 respostas. De fato, parece que isso já aconteceu: as informações que Matt Cutts cita no vídeo são de 2007, enquanto este post de 2009 por John Mu nos fóruns da Central do webmaster do Google diz o contrário:

"Eu acompanhei o 404 vs 410 com a equipe aqui. Como mencionado por alguns outros aqui e em outros lugares, geralmente os tratamos da mesma forma no passado."

No entanto, depois de ver como os webmasters os usam na prática, agora estamos tratando o código de resultado 410 HTTP como um pouco "mais permanente" que o 404. Portanto, se você tiver certeza absoluta de que uma página não existe mais e nunca mais existirá, usar um 410 provavelmente seria uma coisa boa ".

Parece que o Google agora está tratando 410 respostas de maneira diferente das 404s.

Ilmari Karonen
fonte
4

Na minha experiência, o Google não entende 410 códigos de erro.

Há algum tempo, mudei um site completo para que todos os URLs antigos fossem "410 Gone". Não posso usar redirecionamentos 301 porque não há relacionamento direto com um novo URL.

Eu usei um .htaccesspara informar ao Google que os URLs antigos sumiram, mas ele continua me dizendo que há uma enorme quantidade de erros 404 no meu site. Eu verifiquei os URLs no relatório de erro de rastreamento e todos são 410, não 404, como afirma.

user2623424
fonte
1

Há mais do que o Google neste mundo.

Citado pela verdade. Dado o seu requisito, para informar aos robôs (e presumivelmente também aos humanos) que uma página foi removida permanentemente , eu optaria por um 301redirecionamento para uma página explicando (se necessário) por que o conteúdo foi removido ou leve o bot / usuário de volta à página de índice.

Os códigos de erro HTTP menos conhecidos geralmente não são tão bem suportados, compreendidos ou implementados em geral, por isso, geralmente mantenho os que são para garantir a experiência de navegação esperada e esperançosamente perfeita.

A escolha de qual opção seguir depende de quantas solicitações ainda estão sendo recebidas para o conteúdo (agora) ausente.

stealthyninja
fonte
1
Por que a necessidade de explicar a remoção significa que você precisa 301 para um URL diferente com essa explicação? A explicação pode estar na própria página, com um status 410, para que os mecanismos de pesquisa entendam que está morto.
IMSoP