Eu sou novo nisso e também um desenvolvedor PHP de 19 anos que acabou de ser contratado, por isso não tenho certeza de como isso funciona. Muitas empresas ao desenvolver seus sites mantêm seus sites ocultos da indexação. Quais são algumas das maneiras pelas quais o html5 / css e o php / mysql funcionam ocultos nos mecanismos de pesquisa? Se não estou errado, estas são as técnicas:
Desenvolvimento offline: usando armazenamento local para renderizar html / css; não tenho certeza de como o PHP / mysql funcionaria com isso.
Usando .htaccess para impedir o acesso
Usando VPN para impedir o acesso.
Respostas:
A melhor prática é ter uma aproximação da pilha de produção em sua máquina desenvolvedora local. Isso normalmente inclui o banco de dados, o servidor da web e seu código personalizado. Faça todo o seu desenvolvimento lá. Nunca edite o código em um servidor de produção.
Quando as partes interessadas da sua empresa estiverem prontas para a funcionalidade entrar no ar, envie seu código da máquina local para o servidor de produção. Você pode usar um servidor de teste para que as partes interessadas internas possam visualizar suas alterações antes de entrar em operação.
Você deve usar um sistema de controle de versão para gerenciar seu código. Git e Mercurial são opções sólidas.
fonte
Apenas pedir às aranhas de pesquisa que não indexem seu site é uma defesa muito fraca, se houver.
A maneira usual de fazer isso é a seguinte:
Quanto à forma como você definir essas coisas: Se você executar uma distribuição decente * nix, ele vem com um gerenciador de pacotes (
apt
,port-install
,rpm
, etc.); use isso para instalar os componentes necessários e leia a documentação. Peça ajuda a um administrador de sistemas se você não conseguir descobrir sozinho.fonte
Para rastreadores educados (por exemplo, qualquer mecanismo de pesquisa importante), você pode oferecer um
/robots.txt
arquivo com:Claro que isso é apenas um aviso e não impedirá que as pessoas realmente acessem o site se souberem o URL. Uma abordagem melhor é colocar o site atrás de um login de algum tipo, se você precisar acessar da Internet em geral, ou simplesmente hospedar o servidor em um servidor da Web interno.
fonte
No espírito de "entrar com mais conhecimento":
Html / Css pode ser oculto
robots.txt
, mas certifique-se de alterar esses arquivos quando você colocar o site em produção.robots.txt
não impede que uma pessoa aleatória adivinhe o site de desenvolvimento (se for visível para o mundo inteiro)..htaccess
pode ser usado para adicionar uma combinação de nome de usuário / senha a qualquer site em desenvolvimento.Aqui está um exemplo de como você pode usar uma VPN:
Todas as solicitações na VPN passam por um firewall. Esse firewall (executando algum software como o pfSense ) examina as solicitações do site e faz algum redirecionamento com base no URL. Por exemplo, o URL http: //example.com.staging direcionará para a versão de example.com em seu servidor de temporariedade e o URL de http: //example.com.development direcionará para a versão de example.com no seu servidor de desenvolvimento.
Como tudo isso está em uma VPN privada, nenhum desses sites é acessível no mundo exterior.
Além disso, para esclarecer algumas coisas com sua pergunta original. O trabalho php / mysql está sendo feito no servidor , para que os rastreadores da web, navegadores etc. nunca vejam o código - eles apenas veem a saída do código (ou seja, se você configurou o servidor corretamente e não está processando arquivos .php como texto).
Tenho certeza de que interpretou mal sua pergunta, mas achei ambígua o uso da frase "armazenamento local". LocalStorage também pode se referir a uma tecnologia HTML5 para armazenar ativos localmente na máquina do cliente. Não é usado para renderizar html / css, é apenas um armazenamento de dados (o navegador renderiza o html / css). O armazenamento local normalmente não tem nada a ver com o modo como as empresas mantêm os sites ocultos no desenvolvimento.
Os arquivos PHP podem ser visualizados localmente se você estiver executando um servidor Web em sua máquina e os arquivos estiverem nos diretórios apropriados (geralmente o
htdocs
diretório se estiver executando o Apache).fonte
Os mecanismos de pesquisa funcionam usando aranhas : scripts que rastreiam a web de um link para outro. Se o seu site for novo e se não houver links de outros lugares, nada o encontrará. Isso, além de um arquivo robots.txt configurado para impedir que qualquer aranha que de alguma forma passeie pelo seu site o examine, deve ser suficiente.
fonte