Considere uma página, http://example.com
que pode ser exibida publicamente e quando um usuário se autentica. Agora, suponha que você ative o HTTPS para todas as páginas quando um usuário fizer login no seu site, mas apenas quando estiver conectado. Sua página http://example.com
agora se torna https://example.com
para todos os usuários conectados. Se o usuário conectado gostar da sua página e decidir vincular a ela por meio de uma postagem de blog ou site de mídia social, há uma boa chance de que eles usem a versão HTTPS do URL.
De uma perspectiva de SEO, qual é a sua estratégia para evitar problemas de conteúdo duplicado entre os dois URLs?
O que deve acontecer se um usuário chegar ao URL HTTPS, mas não estiver conectado ou não tiver uma conta? Deve haver um redirecionamento para a versão HTTP? Se sim, como você lidaria com isso?
Meu instinto é que, para todas as páginas que podem ser exibidas publicamente e enquanto estiverem logadas, a página deve primeiro detectar se o usuário está logado. Se logada, ela permanece HTTPS ou usa um redirecionamento 302 da versão HTTP para HTTPS. Se o usuário não estiver conectado e chegar à versão HTTPS da URL, ele usará um redirecionamento 301 para a versão HTTP. No entanto, gostaria de receber uma solução mais elegante ou eficaz.
Edit : Eu estava assumindo que, se um usuário estiver logado, todo URL deve ser HTTPS (ou pelo menos isso deve ser uma opção), mas, como fiz uma pesquisa um pouco mais, talvez essa suposição estivesse errada. A maneira como vejo as pessoas implementando é que elas habilitam o HTTPS apenas para páginas que enviam e recebem dados confidenciais: login, checkout do carrinho de compras, gerenciamento de perfis de usuários etc. Estou tentando descobrir qual modelo é o melhor.
Aparentemente, o Google Mail oferece aos usuários a opção de usar ou não HTTPS em todas as páginas através de uma configuração no perfil do usuário. Essa é certamente uma opção, mas eu ainda precisaria abordar o comportamento de páginas publicamente disponíveis para todos os estados de autenticação.
Como estou criando um sistema de gerenciamento de conteúdo que será usado por outras pessoas, preciso garantir que esteja certo. Quais configurações devem estar disponíveis para o proprietário do site? Neste ponto, estou pensando em um controle granular de cada página (esteja ela protegida ou não com SSL) e também de todo o site. No entanto, fornecer esse nível de controle pode ser um erro se as pessoas não entenderem todos os problemas e puderem causar problemas de segurança. Essa talvez seja a primeira questão. Quais são os níveis apropriados de controle e quais são os padrões inteligentes? A segunda é como as páginas devem se comportar para o usuário. De uma perspectiva de SEO, acho que o processo que descrevi acima ou usando orel="canonical"
(como o jmb sugeriu) funcionaria, mas pregar o comportamento da página para que ela seja segura e perfeita também é essencial.
Não há estratégia de SEO para páginas SSL. Parte da definição de armazenamento em cache é esta:
If the request is authenticated or secure (i.e., HTTPS), it won’t be cached.
consulte: tutorial sobre armazenamento em cache
Portanto, para impedir a sobreposição com páginas não SSL, onde isso pode prejudicar a classificação, é ter suas páginas sensíveis a SSL em URLs completamente diferentes.
Ironicamente, eu vi motores de busca realmente armazenar e manter links com o URL HTTPS neles. Isso é contrário ao que normalmente deveria acontecer, mas ocorre nos casos em que a página é uma área de login, é a página inicial ou possui pragma de cache reescrito para permitir o armazenamento em cache. Eu diria que evite isso, se possível, pois sua página geralmente cairá no PageRank.
fonte
O redirecionamento 302 não transfere a classificação de pesquisa - portanto, você pode perder a classificação de pesquisa se você massificar seu site.
301 pode alterar as definições de favoritos, eu não gostaria constantemente de 301 meus usuários.
Além disso, verifique se a versão http inclui um formulário de login para que o usuário possa retornar rapidamente à versão https.
Agora, a grande dúvida é: se os dados estão visíveis no http, por que você tem uma versão https? Quais dados você está ocultando com a criptografia https que ainda não existe?
Você pode criar uma área de membro https ou postar formulários no URL https a partir da página http ou de muitas outras opções que não incluam o site inteiro em http e https.
Além disso, sua ideia parece viável - mas eu não tenho informações privilegiadas sobre como o Google e os outros sites funcionam e você realmente não pode ter certeza de como isso afetará sua classificação (e é um caso tão delicado que pode mudar drasticamente sempre que o Google atualizar o algoritmo).
fonte