Qual foi a maior economia de tempo que você implementou? [fechadas]

37

Quais alterações que você implementou tiveram o maior impacto na economia de tempo na carga de trabalho diária do administrador de sistemas? Quais são seus truques para trabalhar com mais eficiência e realizar mais tarefas ou trabalhar menos para os mesmos resultados?

Estou pensando em automação, alterações no fluxo de trabalho / processos, novas ferramentas, pare de fazer algumas coisas, terceirização, melhor delegação, mudança de software / hardware, redução da burocracia etc.

knweiss
fonte
Esta questão está fora de tópico sob as regras atuais de atualidade.
HopelessN00b

Respostas:

30

monitoramento + alerta - que é uma ótima rede de segurança. Assim como os desenvolvedores escrevem testes de unidade para garantir que as coisas não fiquem bagunçadas quando atualizam o código, confio no monitoramento como rede de segurança adicional para o caso de estragar algo [que é desconectar um servidor, negar tráfego de produção no firewall etc.] . dá tranquilidade - se as coisas quebrarem, saberei antes que os clientes liguem.

pQd
fonte
Mais: temos uma TV enorme na parede, mostrando diagramas rotativos de nossa rede (feitos com nagios e nagvis). Cria uma grande visibilidade, e a versão mais recente do nagvis é impressionante. Dá ao seu chefe e aos seus usuários a sensação de que você está no controle (que é quando você tem isso).
wolfgangsz
26

Para mim, foi autenticação centralizada.

Cheguei ao ponto de administrar 40 máquinas Slackware, ou mais, e cada uma tinha autenticação local, além da autenticação local do Samba. Eu também tinha uma solução VPN em que cada conta precisava ser configurada, além de um servidor jabber interno e um servidor de email interno. Tudo tinha sua própria conta. MAC (Movimentos, Adiciona, Alterações) eram insanos.

Então, mudei do Slackware para o CentOS, criei uma infraestrutura do Active Directory e usei o Likewise Open para autenticar todas as minhas máquinas Linux no AD. Provavelmente me poupava 20 horas por mês sem brincar nem um pouco.

Agora, eu tenho tudo autenticado pelo AD que posso e funciona tremendamente. Não posso recomendar autenticação centralizada o suficiente se você ainda estiver fazendo as coisas da maneira antiga.

Matt Simmons
fonte
Você sabe se do mesmo modo aberto resolverá o problema com domínios confiáveis ​​que o samba faz? Veja serverfault.com/questions/35492/…
chmeee
11
chmeee: Não sei, pois minha infraestrutura não é tão complicada quanto a sua. Eu sugiro que você tente em uma caixa de reposição. Da mesma forma, o Open é gratuito e não faz nenhuma alteração no domínio, exceto a adição da máquina à UO dos computadores AD.
Matt Simmons
Por que AD e não OpenLDAP ou Redhat / Netscape? É predominantemente uma rede Windows?
David Gardner
Porque eu estava familiarizado com AD e não OpenLDAP ou Redhat Directory Server
Matt Simmons
20

Eu concordo com as escolhas óbvias aqui; Automação e autenticação central. No entanto, parece que eu tenho que ser o cara para mencionar a documentação .

Ao documentar o maior número possível de problemas, fluxos de trabalho, instalações e guias, as pessoas puderam solucionar alguns de seus problemas sem a necessidade de incluir nosso departamento.

Outra ótima economia de tempo é o rastreamento de problemas .

Ser capaz de priorizar tarefas, atribuí-las aos membros da equipe e se livrar de toda a confusão de pessoas que enviam solicitações por email, msn ou simplesmente chegam ao escritório. Isso também ajuda nossos bons amigos, os gerentes, a ver como você é eficiente (se quiser).

Então, é claro, a cereja no topo do bolo seria minha caneca 'RTFM' (Leia o Manual Fino), que é muito elevada.

Andrioide
fonte
Monitorar + Alertar imho é muito melhor que a documentação. É uma documentação implícita (não é que eu não goste de documentos escritos). Concordaram com acompanhamento de problemas, não poderia fazer sem
serverhorror
2
Monitonring + Alerting são o "quê". A documentação é o "porquê".
7269 David Mackintosh
Você pode ter todo o monitoramento e alerta que quiser, mas se você não tiver nenhuma documentação sobre o que fazer quando o pager disparar ou notas sobre como estender o monitoramento, ficará preso respondendo a todas as páginas e mantendo todas as o monitoramento de si mesmo. A documentação permite a transferência de conhecimento para que você possa construir sua equipe e permitir que outras pessoas participem para compartilhar o trabalho.
Dannyman
17

A automação de infraestrutura com uma ferramenta como Chef ou Puppet é a melhor coisa que eu implementei nos sistemas que eu gerencio. O monitoramento é excelente e tudo, mas muitas vezes, fazer com que os vários bits funcionem bem com o restante da infraestrutura exige muito trabalho. Chef e Puppet são ótimos em automatizar toda a infraestrutura, fornecendo muita cola que costumava ser escrita à mão. Particularmente reunindo quais servidores fornecem quais serviços.

O Chef tem, embutido, a capacidade de consultar o servidor por atributos e receitas aplicados em outros nós, para que você possa perguntar quem são os servidores Web de produção ou quem é o mestre do banco de dados, facilitando muito a automação. O Puppet também pode fazer isso, mas requer uma ferramenta de classificação de nós externos, como o iClassify .

Isso deve ter implicações óbvias para ferramentas de monitoramento e tendências, como Nagios e Munin. Também pode, por exemplo, fornecer configuração automatizada de ambientes com balanceamento de carga, para que os LBs possam consultar todos os servidores da Web que precisam ser cobertos por um aplicativo específico.

O outro grande poupador de tempo que eu implementei em vários ambientes é compilações automatizadas, como kickstart (redhat / centos) e preseed (debian / ubuntu). Isso deve ser óbvio para a maioria das pessoas, mas pode ser surpreendente quantos sites ainda constroem sistemas a partir do CD. É ainda melhor se a criação automatizada deixar o sistema pronto para executar o Chef ou o Puppet para preparar todos os outros produtos.

jtimberman
fonte
2
O gerenciamento de configuração (eu usei o fantoche) e o servidor PXE (sapateiro) economizavam muito tempo para mim. Mas a maior economia de tempo veio do 'gerenciamento de tempo'; achei o livro de Tom Limoncelli 'Gerenciamento de tempo para administradores de sistema' inestimável nisso. Agora que meu dia está mais estruturado e planejado, passo menos tempo "planejando" e procrastinando e mais tempo apenas fazendo o que é relevante.
Aussielunix 06/07/2009
Ótimas ferramentas de automação, mas você conhece alguma ferramenta semelhante ao Chef ou Puppet que não seja baseada em Ruby?
6119 Andrioid
@Android - cfEngine, mas Chef e Puppet são mais agradáveis ​​de se trabalhar, assim como Ruby: D.
jtimberman
Confira Bcfg2. É semelhante em capacidade ao Puppet, mas escrito em Python.
276 Kamil Kisiel
16

Vários monitores, com uma janela aberta no console de cada servidor pelo qual fui responsável.

Alan H
fonte
6
Isso só será escalado até agora.
Teddy
Sim. Embora eu possa continuar adicionando máquinas adicionais com monitores adicionais, mas na verdade você só pode ir tão longe.
Alan H
7

O monitoramento é ótimo, é claro, mas não tenho certeza de que economiza tempo. Para o meu dinheiro, era o registro centralizado, com um sistema de visualização que filtrava o mundano, destacava o perigoso (falha no disco, verifica o antivírus) e exibia todo o resto para categorização.

syslog (e perl) para a vitória.

Basicamente, me permitiu ler os logs de eventos de todos os computadores da rede enquanto comia meu pãozinho; pelo menos uma verificação superficial para procurar algo assustador. Grande economia de tempo.

Kyle Hodgson
fonte
+1 log centralizado e relatórios com script perl.
10269 David Mackintosh
Estamos lançando a verificação de log em nossos servidores. Está demorando um pouco para adicionar filtros para as linhas com as quais não nos importamos, mas é útil.
22640 David Pashley
11
Eu sei que é comercial, mas dê uma olhada no splunk, um sistema de centralização de logs com um front-end maravilhoso.
James
6

Direitos de administrador local removidos para todos os usuários. (se eu puder)

Isso teve o efeito de agora eu não tenho que lidar com nenhum dos, como faço para instalar o aplicativo X (porque você não tem permissão agora), meu computador tem um vírus / spyware, meu computador está lento e praticamente qualquer coisa relacionada a isso.

Eu nunca redimensionei a estabilidade das estações de trabalho até encontrar uma estação de trabalho que havia sido completamente perdida nas auditorias, atualizações do Windows etc. Ela estava em funcionamento há cerca de 4 anos sem uma única atualização. Eu acho que estava no Windows SP1. Esse site nunca reclamou de nenhum problema com ele e, quando o descobri, achei ótimo.

SpaceManSpiff
fonte
Este é realmente um bom conselho para uma pequena empresa que faz a transição desajeitada para uma empresa de médio porte.
staticsan
11
Deixe-me acrescentar que não funciona agrupar todos os usuários sob uma política como esta. Se houver usuários avançados legítimos (por exemplo, desenvolvedores), eles precisam ser tratados de maneira diferente. Caso contrário, a) eles não podem fazer seu trabalho eb) eles o subvertem de qualquer maneira, causando outros problemas. Portanto, a política precisa estar ciente de muitos tipos de usuários.
Jplindstrom 09/09/09
Não presuma que os desenvolvedores precisam de acesso de administrador. Se eles não tiverem acesso de administrador, talvez eles realmente desenvolvam programas que funcionaram corretamente como usuários limitados (para variar). Existem usuários que precisam, é por isso que eles receberiam uma segunda conta para instalar o software, etc., portanto a conta diária ainda é um usuário limitado. Muito parecido com o funcionamento do mundo Linux. Se eles subvertê-lo, é fácil, demitir a primeira pessoa, o resto entrará na fila bem rápido. Se eles precisam de algo instalado para fazer seu trabalho, solicite o que precisam, e não o acesso de administrador.
SpaceManSpiff
6

Virtualização (VMware)

Entre a implantação de servidores a partir de modelos, o gerenciamento de servidores a partir de uma única interface, o monitoramento detalhado de hardware incorporado ao cliente de infraestrutura, isso realmente mudou a forma como administramos nossa infraestrutura.

E o impacto que teve sobre a forma como pensamos em nosso "hardware" realmente o transformou em um divisor de águas. Os clusters não são mais "muito caros" porque podemos implantá-los virtualmente. Precisa de mais servidores Citrix, clone-o. Enquanto mantivermos nossa fazenda de hardware físico fornecendo recursos adequados (e esses servidores são realmente mercadorias agora), tudo fica pessimista.

Kevin Kuphal
fonte
4

cfengine para gerenciamento de configurações no debian / linux.

openvpn para conectar as estações de satélite

tighvnc através do vpn para alcançar os 2300 Windows Clients nas estações de satélite.

munin e nagios para monitoramento e relatórios

smartmontools nos servidores para verificações saudáveis ​​automáticas (e e-mails de status, se algo der errado)

RAID1 (espelhamento) nos servidores. Se um disco falhar, o servidor ainda está em execução - isso é realmente importante para o meu gerenciamento de tempo.

Meta

TeamWork - É inútil fazer tudo sozinho. compartilhe o trabalho e, juntos, você é mais produtivo.

A atmosfera de trabalho respeita seus companheiros, faz piadas e ri - isso é enorme e útil para uma atmosfera positiva e criativa.

Aproveite o seu trabalho! cara, eu amo meu trabalho! Isso me deixa realmente goog (eu acho;))

ThorstenS
fonte
4

Para mim, era contratar um administrador de sistema muito bom.

FerranB
fonte
3

Fantoche. A idéia de mudar um lugar e ter todos os sistemas afetados é fantástico.

Junte isso às instalações padrão e é muito rápido criar um novo sistema. Você inicializa a rede e executa uma instalação de estoque, e o fantoche assume o controle e tudo é configurado.

Por fim, padronize. Não, você realmente não quer 35 distros linux diferentes e 4 versões diferentes do Solaris. Trabalhe para mudar para uma instalação padrão. Cada sistema exclusivo que você desliga economiza muito tempo.

Bruce ONeel
fonte
2

Adicione outro voto para monitoramento. O princípio é bastante simples: quero saber o que está acontecendo antes que os usuários sejam afetados. A administração do sistema deve idealmente ser uma função transparente. Os usuários não devem saber nem se importar com o que você está fazendo. Da perspectiva deles, deveria simplesmente funcionar. Usuários felizes e satisfeitos devem ser iguais a administradores felizes e satisfeitos.

Uma coisa que geralmente é esquecida na TI é que os computadores estão lá para trabalhar para nós, não o inverso. No entanto, conheço administradores que passam boa parte do dia verificando manualmente seus servidores e logs. Por quê? Os computadores podem se monitorar e, com um pouco de script, você pode ter apenas a parte interessante dos logs. Realmente, você não precisa percorrer alguns milhões de entradas informativas, como o trabalho de impressão de Fred ou a transferência de DNS. Apenas me diga quando não estiverem.

John Gardeniers
fonte
2

A maior economia de tempo que implementei foi a imagem de disco de nossas estações de trabalho de produção. Eles são todos iguais e ninguém armazena nada localmente; por isso, se houver um problema, apenas re-imagino a máquina e está tudo pronto para funcionar, como novo.

steve.lippert
fonte
2

O tempo economizado é mais importante quando os sistemas estão inoperantes.

Documentei todas as informações do contrato de suporte em arquivos de texto padronizados em uma estrutura de diretórios padronizada. Eu tinha uma central e mantinha mais de uma cópia por perto.

Cada bit de informação (portal da web, número de telefone, ponto de contato, data de validade, número do contrato, atalhos do menu do telefone etc.) é precedido por uma tag padrão no antigo formato .ini (tag: data).

Encontrar um número de telefone era tão simples quanto acessar o diretório de nível superior e executar:

grep Phone */*support.txt | more

Onde o primeiro curinga foi expandido para o fornecedor e / ou o nome do produto.

Eu não usei o Excel, Word, OpenOffice, banco de dados etc. etc. simplesmente porque, quando algo está inoperante, pode ser exatamente isso que mantém suas informações de suporte. Além disso, eles não são facilmente visualizáveis ​​na tela do console do modo de texto.

Também documentei todos os procedimentos da mesma maneira.

kmarsh
fonte
Promovido por perceber o valor comercial do tempo.
Jplindstrom 09/09/09
2

Eu implementei um Wiki do departamento de TI (usando o Mediawiki para os interessados) há vários anos. Quando começamos a nos sentir confortáveis ​​em usá-lo, a resposta a muitas perguntas feitas no escritório foi "Você verificou o wiki?" Demorou um pouco de tempo para nos acostumarmos a verificar o Wiki para obter informações específicas, mas, uma vez que o fizemos, percebemos o seu grande potencial. Temos todas as informações necessárias na ponta dos dedos - se houver algo que não existe, temos a capacidade de adicionar / alterar uma página rapidamente.

Russ Warren
fonte
2

Até agora, minha maior economia de tempo foi chaves SSH + ssh-agent + keychain, conforme descrito neste artigo da IBM sobre gerenciamento de chaves OpenSSH

Não há mais senhas para shells, scripts e scp.

NOTA: Ainda tenho uma senha na minha chave privada.

Swoogan
fonte
1

Eu tenho que concordar com o pQd sobre o monitoramento.

Embora ainda não tenhamos visto todos os benefícios, a implementação do gerenciamento de configurações usando o Puppet é promissora para economizar uma quantidade considerável de tempo e reduzir massivamente os erros.

David Pashley
fonte
1

Encontrei o AutoIt e mais tarde o AutoHotkey e me apaixonei.

O último trabalho que tive foi para um fabricante de veículos personalizado. Os montadores eram usuários de computadores minimamente proficientes e conseguiram travar o programa que precisavam usar para inserir em qual trabalho estavam. Todos os dias, várias vezes ao dia, eu tinha que ir a mais de 15 estações de trabalho em três edifícios diferentes e matar o programa travado, reiniciá-lo e devolvê-lo à tela de entrada de dados. Eventualmente, instalei o VNC para que eu pudesse fazê-lo remotamente, o que reduzia o tempo de viagem, mas ainda envolvia a lembrança de entrar e reiniciar as máquinas de vez em quando. Quando encontrei o AutoIt, percebi que podia definir o programa para assistir ao computador e, se não houvesse nenhuma entrada por 5 minutos, ele poderia redefinir o programa e digitar e clicar em tudo o que fosse necessário para voltar à tela de entrada.

Joseph
fonte
1

++ para autenticação central e gerenciamento de contas, incluindo criação de conta E tratamento de encerramento. Temos AD (duas florestas) e LDAP (e, até recentemente, NDS) com vários grupos acessando recursos existentes em qualquer diretório. O tempo que dedicamos a sincronizar os diretórios e gerenciar todos os recursos em um ou outro diretório valeu a pena.

A próxima maior vitória foi qualquer automação, seja na limpeza de contas, na centralização de configurações ou no que você tem.

Não sei quanto tempo realmente monitora economiza, mas é essencial. Não é preciso muito para que um ambiente fique grande o suficiente ou complexo o suficiente para que a "verificação manual" seja impossível e ineficaz. Além disso, às vezes é bom dormir. ;)

Isso pode estar um pouco fora da linha principal de pensar sobre isso, mas também tivemos uma grande vitória quando padronizamos nossa plataforma de hardware. Escolhemos uma plataforma de servidor viável para todo o nosso sistema operacional internamente e a mantemos por vários anos. Aprendemos o hardware e o gerenciamento remoto, economizando tempo e energia de várias maneiras:

  1. Não há mais suporte para meia dúzia ou mais de tipos instáveis ​​de servidores, cada um com suas próprias peculiaridades
  2. Suporte entre equipes: no que diz respeito ao hardware, o pessoal do Unix o conhece, o pessoal do Windows o conhece, até o pessoal da rede está familiarizado o suficiente para dar uma mãozinha conforme necessário, pois vários de seus aparelhos rodam no hardware.
  3. partes separadas!

O mesmo vale para compilações de SO padrão, documentadas e revisadas. Pode parecer básico, mas encontro lojas frequentemente onde as compilações não são padrão e não há como parar para ver se essa ferramenta ou essa ferramenta está presente ou se um determinado servidor tem suas configurações corretas. Esse tipo de caos pode transformar até as tarefas e os problemas mais básicos em brocas de fogo.

damorg
fonte
1

Aprender a delegar e confiar em meus colegas - uma vez que você saiba que pode entregar parte do trabalho para outras pessoas, a vida se torna muito mais relaxada. E não porque sou preguiçosa e todos os demais fazem o meu trabalho por mim; é a tranquilidade de saber que você tem um bom backup. E, é claro, configurações de SO padronizadas e bem monitoradas em hardware padrão. Vai sem dizer.

Meu objetivo para a automação sempre foi que agora recebo novamente um e-mail dizendo "Tal e tal falha no servidor foo. Foi corrigido". e depois que eu enviar o bug para os desenvolvedores, posso voltar a ler o jornal e tomar café. Ainda não chegamos, mas percorremos um longo caminho desde o caos reativo que costumávamos lutar todos os dias.

user2278
fonte
1

Eu recentemente implementei o AntHill Pro no trabalho e agora tenho todas as nossas compilações e implantações para vários projetos completamente automatizados e rastreados. Isso incluiu a criação de uma biblioteca Ant compartilhada de implantação do Tomcat usada por todos os projetos, simplificando a manutenção desses projetos no AHP. A seguir, é criar uma biblioteca semelhante para implantações de CDA do site.

Embora não me poupe tempo pessoalmente, economiza o tempo de nossos desenvolvedores e nossa equipe de operações. Gosto de ser a lata de óleo para as rodas de outras pessoas. :-)

Espero ver o Chef e o Puppet ao lado para ajudar no lado da infraestrutura de automatizar as coisas.

Ah, e a documentação é uma enorme ajuda. Economiza muito tempo apenas para apontar as pessoas para um documento bem escrito, em vez de responder à mesma pergunta 20 vezes.

Brian Kelly
fonte
1

Meu maior poupador de tempo foram os scripts preseed para a instalação de nossas estações de trabalho Linux. temos contratados indo e vindo o tempo todo, portanto, temos um conjunto de estações de trabalho que são reutilizadas regularmente. Quando eles retornam à TI, nós inserimos o CD de instalação, adicionamos o arquivo preseed ao comando install e em 20 minutos (e não há mais pressionamentos de teclas de qualquer um de nós) a caixa está de volta a uma instalação nova e funcional, com todos as ferramentas e pré-configuradas para serem executadas em nossa rede. Plug'n'play.

wolfgangsz
fonte