Arquivos que eu deveria ter em todos os sites

36

Eu gostaria de ter uma lista de arquivos que deveriam existir em todos os sites. A idéia é agradar a maioria dos navegadores e bots e diminuir o número de 404 mensagens nos logs.

Até agora, tenho os seguintes arquivos:

  • /favicon.ico
  • /robots.txt
  • /sitemap.xml
  • /apple-touch-icon-72x72-precomposed.png
  • /apple-touch-icon-72x72.png
  • /apple-touch-icon-precomposed.png
  • /apple-touch-icon.png

Existem outros arquivos que são solicitados com frequência e devem estar em todos os sites?

Raffael Luthiger
fonte
2
Eu odeio aqueles! WTF eles estão pensando? Se eu quisesse que eles usassem, eu os teria adicionado ... #
PeeHaa
1
Eu entendo você ... Mas o que eu mais odeio são 404 mensagens no meu log do apache.
Raffael Luthiger
2
para ser claro. O que eu odeio é que os user-agents tentem acessá-los por padrão.
PeeHaa
Isso leva a uma pergunta diferente. Parece que sua principal preocupação é reduzir os logs 404 "estranhos". Você está recebendo muitos logs 404 legítimos que precisa classificar? Ou você está tentando classificar no log outros erros e os 404 estão atrapalhando?
21411 Chris
1
Não tenho problemas com navegadores que procuram ícones do site automaticamente, pois isso evita que os webmasters incluam uma referência a eles em todas as páginas. No entanto, eu gostaria que a Apple tivesse aderido ao padrão favicon, que suporta canais alfa e vários tamanhos de ícones.
Lèse majesté 15/02/2012

Respostas:

21

Até onde eu sei, nenhum robô ou aplicativo solicita o sitemap.xml sem que seja solicitado que ele esteja lá. A maioria dos sites provavelmente não o possui e, dos sites que o fazem, muitos usam o gzip e muitos chamam o arquivo de outra coisa ou colocam os sitemaps em uma subpasta.

Aqui estão todos os que eu conheço:

  • favicon.ico
    Dá às suas páginas um ícone em guias, favoritos etc.
  • robots.txt
    Útil se você precisar bloquear qualquer página dos mecanismos de pesquisa, mas pode ficar em branco para permitir o acesso a tudo. Também pode conter a localização do seu mapa do site.
  • Arquivos de verificação das Ferramentas do Google para webmasters
    O método mais fácil de verificação (economiza ter metatags inúteis no seu código HTML). Há google[hash].htmle BingSiteAuth.xml. Também tenho um para o Yahoo na minha raiz, mas isso provavelmente não é mais necessário.
  • crossdomain.xml
    Esse arquivo é solicitado pelo Adobe Flash sempre que o Flash precisar se conectar ao seu site. Você provavelmente nunca verá esse arquivo nos seus logs em um site pequeno, mas eu tinha vários pedidos em um site. Você pode apenas criar um arquivo em branco, pois o padrão é bloquear o acesso a sites externos.
  • .htaccess (Apache)
    Obviamente, não é solicitado pelos navegadores / bots, mas é vital para a maioria dos sites.

Por fim, em relação aos ícones que o iPhone insiste em solicitar: existem vários tamanhos que podem ser solicitados. Meu iPhone 3G (iOS 5) solicita a versão 57x57 e vejo 72x72 e 114x114 (mais comuns) nos meus logs de erros. Portanto, se você deseja eliminar todos os 404s dos seus logs, é incompreensível que você precise fornecer tudo isso:

  • /apple-touch-icon-57x57-precomposed.png
  • /apple-touch-icon-57x57.png
  • /apple-touch-icon-72x72-precomposed.png
  • /apple-touch-icon-72x72.png
  • /apple-touch-icon-114x114-precomposed.png
  • /apple-touch-icon-114x114.png
  • /apple-touch-icon-precomposed.png
  • /apple-touch-icon.png
DisgruntledGoat
fonte
1
.htaccessé específico para o Apache e, mesmo para aqueles que usam o Apache, é uma má escolha de desempenho se alguém tiver acesso às definições do VirtualHost.
Danlefree
+1 para crossdomain.xml - isso não me ocorreu e é uma ótima ideia para incluir.
Jacob Hume
Eu já tive um bot solicitando o sitemap.xml uma vez por dia. E nunca registrei esse arquivo em algum lugar. Então este bot estava apenas adivinhando.
Raffael Luthiger
@DisgruntledGoat: Obrigado pela atualização. Eu não sabia que esses outros tamanhos também existem.
Raffael Luthiger
1
O Silverlight também usa clientaccesspolicy.xml.
Lèse majesté 15/02/2012
3

Eu acho que você provavelmente tem.

Mesmo o ícone do Apple Touch não é totalmente necessário, pois se você optar por não tê-lo (e não vincular a ele), o iOS usará apenas uma miniatura da página (pessoalmente, eu as adiciono).

Eu diria que você realmente precisa do favicon.ico e do robots.txt , o sitemap.xml também é opcional.

Codecraft
fonte
1
Isso não impediria a solicitação e, portanto, os erros 404 que Raffael está vendo em seus logs. Se você fosse se concentrar em quais arquivos causam maior impacto, eu diria que você está certo.
Jacob Hume
2

Outro que eu notei é o browserconfig.xml, que é uma bastardização solicitada pelo IE. Sangue ensanguentado enchendo os troncos.

Lenny
fonte
Obrigado. Você sabe o que deve estar neste arquivo?
Raffael Luthiger
1

As versões mais recentes da apple solicitam esses arquivos (nesta ordem)

  • /apple-touch-icon-120x120-precomposed.png
  • /apple-touch-icon-120x120.png
  • /apple-touch-icon-precomposed.png
  • /apple-touch-icon.png
Mark Van Tilburg
fonte
Obrigado. Isso estenderia a lista do DisgruntledGoat.
Raffael Luthiger