Quais alterações que você implementou tiveram o maior impacto na economia de tempo na carga de trabalho diária do administrador de sistemas? Quais são seus truques para trabalhar com mais eficiência e realizar mais tarefas ou trabalhar menos para os mesmos resultados?
Estou pensando em automação, alterações no fluxo de trabalho / processos, novas ferramentas, pare de fazer algumas coisas, terceirização, melhor delegação, mudança de software / hardware, redução da burocracia etc.
Respostas:
monitoramento + alerta - que é uma ótima rede de segurança. Assim como os desenvolvedores escrevem testes de unidade para garantir que as coisas não fiquem bagunçadas quando atualizam o código, confio no monitoramento como rede de segurança adicional para o caso de estragar algo [que é desconectar um servidor, negar tráfego de produção no firewall etc.] . dá tranquilidade - se as coisas quebrarem, saberei antes que os clientes liguem.
fonte
Para mim, foi autenticação centralizada.
Cheguei ao ponto de administrar 40 máquinas Slackware, ou mais, e cada uma tinha autenticação local, além da autenticação local do Samba. Eu também tinha uma solução VPN em que cada conta precisava ser configurada, além de um servidor jabber interno e um servidor de email interno. Tudo tinha sua própria conta. MAC (Movimentos, Adiciona, Alterações) eram insanos.
Então, mudei do Slackware para o CentOS, criei uma infraestrutura do Active Directory e usei o Likewise Open para autenticar todas as minhas máquinas Linux no AD. Provavelmente me poupava 20 horas por mês sem brincar nem um pouco.
Agora, eu tenho tudo autenticado pelo AD que posso e funciona tremendamente. Não posso recomendar autenticação centralizada o suficiente se você ainda estiver fazendo as coisas da maneira antiga.
fonte
Eu concordo com as escolhas óbvias aqui; Automação e autenticação central. No entanto, parece que eu tenho que ser o cara para mencionar a documentação .
Ao documentar o maior número possível de problemas, fluxos de trabalho, instalações e guias, as pessoas puderam solucionar alguns de seus problemas sem a necessidade de incluir nosso departamento.
Outra ótima economia de tempo é o rastreamento de problemas .
Ser capaz de priorizar tarefas, atribuí-las aos membros da equipe e se livrar de toda a confusão de pessoas que enviam solicitações por email, msn ou simplesmente chegam ao escritório. Isso também ajuda nossos bons amigos, os gerentes, a ver como você é eficiente (se quiser).
Então, é claro, a cereja no topo do bolo seria minha caneca 'RTFM' (Leia o Manual Fino), que é muito elevada.
fonte
A automação de infraestrutura com uma ferramenta como Chef ou Puppet é a melhor coisa que eu implementei nos sistemas que eu gerencio. O monitoramento é excelente e tudo, mas muitas vezes, fazer com que os vários bits funcionem bem com o restante da infraestrutura exige muito trabalho. Chef e Puppet são ótimos em automatizar toda a infraestrutura, fornecendo muita cola que costumava ser escrita à mão. Particularmente reunindo quais servidores fornecem quais serviços.
O Chef tem, embutido, a capacidade de consultar o servidor por atributos e receitas aplicados em outros nós, para que você possa perguntar quem são os servidores Web de produção ou quem é o mestre do banco de dados, facilitando muito a automação. O Puppet também pode fazer isso, mas requer uma ferramenta de classificação de nós externos, como o iClassify .
Isso deve ter implicações óbvias para ferramentas de monitoramento e tendências, como Nagios e Munin. Também pode, por exemplo, fornecer configuração automatizada de ambientes com balanceamento de carga, para que os LBs possam consultar todos os servidores da Web que precisam ser cobertos por um aplicativo específico.
O outro grande poupador de tempo que eu implementei em vários ambientes é compilações automatizadas, como kickstart (redhat / centos) e preseed (debian / ubuntu). Isso deve ser óbvio para a maioria das pessoas, mas pode ser surpreendente quantos sites ainda constroem sistemas a partir do CD. É ainda melhor se a criação automatizada deixar o sistema pronto para executar o Chef ou o Puppet para preparar todos os outros produtos.
fonte
Vários monitores, com uma janela aberta no console de cada servidor pelo qual fui responsável.
fonte
O monitoramento é ótimo, é claro, mas não tenho certeza de que economiza tempo. Para o meu dinheiro, era o registro centralizado, com um sistema de visualização que filtrava o mundano, destacava o perigoso (falha no disco, verifica o antivírus) e exibia todo o resto para categorização.
syslog (e perl) para a vitória.
Basicamente, me permitiu ler os logs de eventos de todos os computadores da rede enquanto comia meu pãozinho; pelo menos uma verificação superficial para procurar algo assustador. Grande economia de tempo.
fonte
Direitos de administrador local removidos para todos os usuários. (se eu puder)
Isso teve o efeito de agora eu não tenho que lidar com nenhum dos, como faço para instalar o aplicativo X (porque você não tem permissão agora), meu computador tem um vírus / spyware, meu computador está lento e praticamente qualquer coisa relacionada a isso.
Eu nunca redimensionei a estabilidade das estações de trabalho até encontrar uma estação de trabalho que havia sido completamente perdida nas auditorias, atualizações do Windows etc. Ela estava em funcionamento há cerca de 4 anos sem uma única atualização. Eu acho que estava no Windows SP1. Esse site nunca reclamou de nenhum problema com ele e, quando o descobri, achei ótimo.
fonte
Virtualização (VMware)
Entre a implantação de servidores a partir de modelos, o gerenciamento de servidores a partir de uma única interface, o monitoramento detalhado de hardware incorporado ao cliente de infraestrutura, isso realmente mudou a forma como administramos nossa infraestrutura.
E o impacto que teve sobre a forma como pensamos em nosso "hardware" realmente o transformou em um divisor de águas. Os clusters não são mais "muito caros" porque podemos implantá-los virtualmente. Precisa de mais servidores Citrix, clone-o. Enquanto mantivermos nossa fazenda de hardware físico fornecendo recursos adequados (e esses servidores são realmente mercadorias agora), tudo fica pessimista.
fonte
cfengine para gerenciamento de configurações no debian / linux.
openvpn para conectar as estações de satélite
tighvnc através do vpn para alcançar os 2300 Windows Clients nas estações de satélite.
munin e nagios para monitoramento e relatórios
smartmontools nos servidores para verificações saudáveis automáticas (e e-mails de status, se algo der errado)
RAID1 (espelhamento) nos servidores. Se um disco falhar, o servidor ainda está em execução - isso é realmente importante para o meu gerenciamento de tempo.
Meta
TeamWork - É inútil fazer tudo sozinho. compartilhe o trabalho e, juntos, você é mais produtivo.
A atmosfera de trabalho respeita seus companheiros, faz piadas e ri - isso é enorme e útil para uma atmosfera positiva e criativa.
Aproveite o seu trabalho! cara, eu amo meu trabalho! Isso me deixa realmente goog (eu acho;))
fonte
Para mim, era contratar um administrador de sistema muito bom.
fonte
Fantoche. A idéia de mudar um lugar e ter todos os sistemas afetados é fantástico.
Junte isso às instalações padrão e é muito rápido criar um novo sistema. Você inicializa a rede e executa uma instalação de estoque, e o fantoche assume o controle e tudo é configurado.
Por fim, padronize. Não, você realmente não quer 35 distros linux diferentes e 4 versões diferentes do Solaris. Trabalhe para mudar para uma instalação padrão. Cada sistema exclusivo que você desliga economiza muito tempo.
fonte
Adicione outro voto para monitoramento. O princípio é bastante simples: quero saber o que está acontecendo antes que os usuários sejam afetados. A administração do sistema deve idealmente ser uma função transparente. Os usuários não devem saber nem se importar com o que você está fazendo. Da perspectiva deles, deveria simplesmente funcionar. Usuários felizes e satisfeitos devem ser iguais a administradores felizes e satisfeitos.
Uma coisa que geralmente é esquecida na TI é que os computadores estão lá para trabalhar para nós, não o inverso. No entanto, conheço administradores que passam boa parte do dia verificando manualmente seus servidores e logs. Por quê? Os computadores podem se monitorar e, com um pouco de script, você pode ter apenas a parte interessante dos logs. Realmente, você não precisa percorrer alguns milhões de entradas informativas, como o trabalho de impressão de Fred ou a transferência de DNS. Apenas me diga quando não estiverem.
fonte
A maior economia de tempo que implementei foi a imagem de disco de nossas estações de trabalho de produção. Eles são todos iguais e ninguém armazena nada localmente; por isso, se houver um problema, apenas re-imagino a máquina e está tudo pronto para funcionar, como novo.
fonte
O tempo economizado é mais importante quando os sistemas estão inoperantes.
Documentei todas as informações do contrato de suporte em arquivos de texto padronizados em uma estrutura de diretórios padronizada. Eu tinha uma central e mantinha mais de uma cópia por perto.
Cada bit de informação (portal da web, número de telefone, ponto de contato, data de validade, número do contrato, atalhos do menu do telefone etc.) é precedido por uma tag padrão no antigo formato .ini (tag: data).
Encontrar um número de telefone era tão simples quanto acessar o diretório de nível superior e executar:
Onde o primeiro curinga foi expandido para o fornecedor e / ou o nome do produto.
Eu não usei o Excel, Word, OpenOffice, banco de dados etc. etc. simplesmente porque, quando algo está inoperante, pode ser exatamente isso que mantém suas informações de suporte. Além disso, eles não são facilmente visualizáveis na tela do console do modo de texto.
Também documentei todos os procedimentos da mesma maneira.
fonte
Eu implementei um Wiki do departamento de TI (usando o Mediawiki para os interessados) há vários anos. Quando começamos a nos sentir confortáveis em usá-lo, a resposta a muitas perguntas feitas no escritório foi "Você verificou o wiki?" Demorou um pouco de tempo para nos acostumarmos a verificar o Wiki para obter informações específicas, mas, uma vez que o fizemos, percebemos o seu grande potencial. Temos todas as informações necessárias na ponta dos dedos - se houver algo que não existe, temos a capacidade de adicionar / alterar uma página rapidamente.
fonte
Até agora, minha maior economia de tempo foi chaves SSH + ssh-agent + keychain, conforme descrito neste artigo da IBM sobre gerenciamento de chaves OpenSSH
Não há mais senhas para shells, scripts e scp.
NOTA: Ainda tenho uma senha na minha chave privada.
fonte
Eu tenho que concordar com o pQd sobre o monitoramento.
Embora ainda não tenhamos visto todos os benefícios, a implementação do gerenciamento de configurações usando o Puppet é promissora para economizar uma quantidade considerável de tempo e reduzir massivamente os erros.
fonte
Encontrei o AutoIt e mais tarde o AutoHotkey e me apaixonei.
O último trabalho que tive foi para um fabricante de veículos personalizado. Os montadores eram usuários de computadores minimamente proficientes e conseguiram travar o programa que precisavam usar para inserir em qual trabalho estavam. Todos os dias, várias vezes ao dia, eu tinha que ir a mais de 15 estações de trabalho em três edifícios diferentes e matar o programa travado, reiniciá-lo e devolvê-lo à tela de entrada de dados. Eventualmente, instalei o VNC para que eu pudesse fazê-lo remotamente, o que reduzia o tempo de viagem, mas ainda envolvia a lembrança de entrar e reiniciar as máquinas de vez em quando. Quando encontrei o AutoIt, percebi que podia definir o programa para assistir ao computador e, se não houvesse nenhuma entrada por 5 minutos, ele poderia redefinir o programa e digitar e clicar em tudo o que fosse necessário para voltar à tela de entrada.
fonte
++ para autenticação central e gerenciamento de contas, incluindo criação de conta E tratamento de encerramento. Temos AD (duas florestas) e LDAP (e, até recentemente, NDS) com vários grupos acessando recursos existentes em qualquer diretório. O tempo que dedicamos a sincronizar os diretórios e gerenciar todos os recursos em um ou outro diretório valeu a pena.
A próxima maior vitória foi qualquer automação, seja na limpeza de contas, na centralização de configurações ou no que você tem.
Não sei quanto tempo realmente monitora economiza, mas é essencial. Não é preciso muito para que um ambiente fique grande o suficiente ou complexo o suficiente para que a "verificação manual" seja impossível e ineficaz. Além disso, às vezes é bom dormir. ;)
Isso pode estar um pouco fora da linha principal de pensar sobre isso, mas também tivemos uma grande vitória quando padronizamos nossa plataforma de hardware. Escolhemos uma plataforma de servidor viável para todo o nosso sistema operacional internamente e a mantemos por vários anos. Aprendemos o hardware e o gerenciamento remoto, economizando tempo e energia de várias maneiras:
O mesmo vale para compilações de SO padrão, documentadas e revisadas. Pode parecer básico, mas encontro lojas frequentemente onde as compilações não são padrão e não há como parar para ver se essa ferramenta ou essa ferramenta está presente ou se um determinado servidor tem suas configurações corretas. Esse tipo de caos pode transformar até as tarefas e os problemas mais básicos em brocas de fogo.
fonte
Aprender a delegar e confiar em meus colegas - uma vez que você saiba que pode entregar parte do trabalho para outras pessoas, a vida se torna muito mais relaxada. E não porque sou preguiçosa e todos os demais fazem o meu trabalho por mim; é a tranquilidade de saber que você tem um bom backup. E, é claro, configurações de SO padronizadas e bem monitoradas em hardware padrão. Vai sem dizer.
Meu objetivo para a automação sempre foi que agora recebo novamente um e-mail dizendo "Tal e tal falha no servidor foo. Foi corrigido". e depois que eu enviar o bug para os desenvolvedores, posso voltar a ler o jornal e tomar café. Ainda não chegamos, mas percorremos um longo caminho desde o caos reativo que costumávamos lutar todos os dias.
fonte
Eu recentemente implementei o AntHill Pro no trabalho e agora tenho todas as nossas compilações e implantações para vários projetos completamente automatizados e rastreados. Isso incluiu a criação de uma biblioteca Ant compartilhada de implantação do Tomcat usada por todos os projetos, simplificando a manutenção desses projetos no AHP. A seguir, é criar uma biblioteca semelhante para implantações de CDA do site.
Embora não me poupe tempo pessoalmente, economiza o tempo de nossos desenvolvedores e nossa equipe de operações. Gosto de ser a lata de óleo para as rodas de outras pessoas. :-)
Espero ver o Chef e o Puppet ao lado para ajudar no lado da infraestrutura de automatizar as coisas.
Ah, e a documentação é uma enorme ajuda. Economiza muito tempo apenas para apontar as pessoas para um documento bem escrito, em vez de responder à mesma pergunta 20 vezes.
fonte
Meu maior poupador de tempo foram os scripts preseed para a instalação de nossas estações de trabalho Linux. temos contratados indo e vindo o tempo todo, portanto, temos um conjunto de estações de trabalho que são reutilizadas regularmente. Quando eles retornam à TI, nós inserimos o CD de instalação, adicionamos o arquivo preseed ao comando install e em 20 minutos (e não há mais pressionamentos de teclas de qualquer um de nós) a caixa está de volta a uma instalação nova e funcional, com todos as ferramentas e pré-configuradas para serem executadas em nossa rede. Plug'n'play.
fonte