Recentemente, um dos principais servidores de arquivos da nossa empresa falhou. Ele estava usando uma matriz RAID de 4 discos, mas aparentemente 3 dos discos morreram e todos os dados no servidor foram perdidos.
Falando com o administrador do sistema, ele diz que está avisando a alta gerência sobre a situação do backup há meses. Ele estava tentando obter aprovação para comprar uma solução de backup em nível corporativo, mas nunca conseguiu o orçamento para isso - porque a gerência achou que estava exagerado.
O administrador do sistema é um administrador do sistema dedicado e devidamente certificado, enquanto seus gerentes não são orientados a TI.
Seu gerente está perguntando por que ele não comprou uma unidade externa barata e a usou para fazer backup do servidor de arquivos. O administrador do sistema pensa que esta é apenas uma solução mickey-mouse adequada para uso em casa, mas não uma empresa profissional de TI - e é por isso que ele não fez isso.
Parece-me que o administrador do sistema quer uma estratégia de TI adequada, de livros didáticos, que custa muito mais dinheiro, enquanto a gerência (sem um profundo conhecimento de TI) quer soluções mais baratas que julgarem adequadas.
Gostaria de saber qual é a opinião de outros administradores de sistema? Esse administrador do sistema estava correto em suas ações? Ou ele deve sempre garantir um backup dos dados importantes, mesmo que ele acredite que a maneira mais barata não seja boa o suficiente?
Editar: com base nas respostas, acrescentarei que o administrador do sistema tem um gerente de TI que saberia da situação. Ele se reporta ao chefe supremo. Não sei se o gerente relatou a situação completa ao chefe. Eu acho que é muito difícil para o gerente, pois ele está preso no meio e ele quer ser diplomático com os dois lados.
Respostas:
Concordo que fazer o que é certo é o método preferido. Mas ficar parado e não fazer nada não é profissional. A gerência foi informada de que não havia backup? É tarefa dos administradores apresentar as opções, incluindo custos e riscos, à gerência. Ele apresentou sua opção preferida e, quando foi negado, não fez nada. Não é legal.
fonte
Eu honestamente diria que é um fracasso de ambas as partes.
A logística da situação pode significar que ele teria que gastar um tempo gasto com outras tarefas importantes e imediatas.
No entanto, em última análise, sim, ele deveria ter feito algo. Um monte de discos rígidos daqui e de lá teria sido melhor do que nada, como já foi dito repetidamente.
Por outro lado, todo o objetivo do gerenciamento é garantir que as pessoas abaixo de você possam fazer o trabalho delas. e, portanto, do ponto de vista da liderança, os gerentes falharam miseravelmente e podem ser considerados igualmente responsáveis, se não mais.
fonte
Se não houver backups, no que me diz respeito, é responsabilidade do administrador de sistemas:
1) Diga explicitamente aos superiores que NÃO há backups, em termos inequívocos, para que eles saibam disso
2) Faça o backup dos dados de qualquer maneira, da maneira que ele puder
Francamente, eu esperaria ser demitido se isso acontecesse, porque mesmo que a administração esteja dificultando minha vida, isso não é desculpa, especialmente se eles ainda têm a impressão de que têm algo em vez de nada.
fonte
É maldito se você faz, condenado se você não faz. Francamente, se não houve dinheiro gasto pelo gerenciamento em uma solução de backup, a culpa foi deles. Por outro lado, o administrador deveria ter sido ativo na tentativa de encontrar uma solução paliativa, em vez de apenas ficar sentado esperando que algo quebrasse (não acho que qualquer tipo de solução de unidade externa seja aceitável. você nunca pode obter um backup decente com isso.) Você não pode simplesmente dizer: "Bem, eu não tenho o que quero , por isso não sou responsável", mas você pode dizer: "Tentei repetidamente buscá-lo fazer alguma coisa e você não me deu nada e esse não é o meu problema. "
Na verdade, eu já estava em uma situação - eu nem era ADMIN nesse trabalho - onde trabalhava em um banco de dados e fiz um backup antes de alterá-lo (que é sop) e eu (como normalmente faço). , sempre que posso) salvou em minha própria máquina local. Dois dias depois, eles perderam o conjunto de ataques e, ooops, descobriram que não havia solução de backup. Eles estavam fazendo backup do banco de dados na matriz de ataque.
Então, eu chego atrasado nisso e digo: "Ah, eu fiz backup antes de ontem".
Você sabe qual foi o resultado? Fui censurado pela minha solução de backup ruim. Por uma máquina pela qual eu não era de forma alguma responsável. E não foi porque o backup que eu tinha era muito antigo, é porque eu havia feito backup apenas do banco de dados em que estava trabalhando, e não de todo banco de dados.
Portanto, o problema é o seguinte: se você faz uma solução para o mouse mickey, se faz alguma coisa e não é boa o suficiente, vai sofrer tanto como se não fizesse nada. Se os backups são de sua responsabilidade, explicitamente, e não há orçamento, você deve tentar montar algo juntos, mas é melhor garantir que funcione, e você precisa se preocupar com isso. Repetidamente. Em todas as oportunidades.
Se não é sua responsabilidade, indique que existe um problema e, absolutamente, categoricamente, se recuse a assumir a responsabilidade por um mandato não financiado quando tentarem atribuí-lo a você. Ninguém faz da recuperação de desastres uma prioridade até que ocorra um desastre, e então eles bodeiam todos para tentar compensar sua própria falta de visão.
fonte
Infelizmente, as empresas que economizam nos backups são muito comuns. A maioria nunca muda até que se queime e perca tudo.
MAS
Se você trabalha para ser o administrador de sistemas, precisa trabalhar com as ferramentas disponíveis, incluindo o cérebro. Não importa o que a gerência ou qualquer outra pessoa diga em bons dias, quando o cocô atinge o ventilador, todos recebem memória seletiva.
Um backup do mouse mickey é melhor do que nenhum backup.
fonte
Para mim, parece que o administrador do sistema queria tudo ou nada. É bom ter tudo, mas se você não pode ter, não deve aceitar nada?
Na minha experiência, o que se deve fazer é avaliar todas as opções possíveis (sem muita profundidade) e elaborar alguns pontos para cada um, indicando os prós e os contras, os custos (iniciais e contínuos). Inclua aqui a opção "não fazer nada".
Então você permite que os gerentes decidam qual solução eles escolherão. Parece-me que provavelmente havia mais de uma opção possível para o seu administrador de sistemas. Talvez ele só tenha visto o que ele realmente queria?
fonte
Vou acrescentar minha voz àqueles dizendo que o administrador deveria ter implementado algo aqui. Ele é muito culpado por não ter feito isso. Há uma parte de mim que gostaria de simpatizar com sua posição, mas em um mundo ideal, o backup e a restauração não levariam tempo, sempre funcionariam e nunca seriam necessários. Esse não é o mundo e até a melhor solução de backup terá falhas que você precisará aceitar e aprender a trabalhar.
Meia-bunda é melhor do que não-bunda, e mesmo usando um USB HD el-cheappo o teria tirado da floresta, e teria dado peso à sua posição quando a gerência é informada de que eles não podem obter dados mais do que o dia ou dois anos atrás. Mas isso ainda teria salvado seu pescoço neste caso.
fonte
Não sei se diria que você deve fazer um backup sob quaisquer condições . Há algumas coisas que você pode ser tentado a fazer que possivelmente seriam ilegais. Por exemplo, eu não faria backup de registros de saúde pela rede para o meu computador pessoal. Eu não faria algo ilegal apenas para ter um backup.
OTOH para ter pelo menos algum sistema de backup em funcionamento, eu aceitaria muitos compromissos. Então, sempre que um compromisso era feito, eu fazia questão de garantir que minhas objeções fossem claras e documentadas sobre por que era um compromisso ruim que causaria problemas, seria inadequado ou se tornaria menos útil no futuro.
fonte
Como administrador de sistemas, acredito que seja minha responsabilidade garantir que os sistemas sob meus cuidados sejam os mais seguros e confiáveis possíveis. Os backups se enquadram nas tags de confiabilidade. Por mais frustrante que seja ter que discutir com funcionários seniores que não entendem (acho que todos já estivemos lá em algum momento ou outro), ainda deveríamos estar fazendo nosso trabalho da melhor maneira possível.
Quando o sistema de backup que herdei na minha posição atual falhou e a gerência hesitou em gastar o dinheiro no sistema que queria, não o deixei sem backups. Em vez disso, trouxe minha unidade externa pessoal e a usei por mais ou menos uma semana. Apesar de ter uma aversão absoluta ao usar discos rígidos para backups, permanece o fato de que era muito preferível a não ter nenhum.
fonte
Se o administrador do sistema não conseguiu convencer o gerenciamento da importância de uma boa solução de backup, a única maneira de convencê-lo é através da perda de dados catastrófica, mas como administrador do sistema, é sua responsabilidade educar o gerenciamento e os usuários sobre a importância de coisas como backup , e para garantir que eles entendam completamente o estado atual (neste caso, "sem backups") e as possíveis consequências ("Perdemos um disco e seus dados preciosos desaparecem para sempre").
Minha opinião pessoal é que o administrador meio que estragou tudo aqui: backups ad-hoc são uma má idéia (você perderá coisas, dados importantes serão perdidos, se você não estiver por perto, os backups não acontecerão), mas ao mesmo tempo tempo, eles deveriam ter conseguido encontrar uma solução de backup "corporativa" confiável dentro do orçamento da empresa.
Programas como Bacula e Amanda estão disponíveis gratuitamente, e ambos podem funcionar com mídia removível e CDs USB de maneira segura e confiável. Incluindo o custo de mídia e hardware do servidor, você pode ter um bom sistema por menos de US $ 2000 - ainda mais barato se reciclar o hardware do servidor.
Agora, se a gestão também se opõe à despesa de administração TEMPO em obter apoios trabalhando há apenas não ajudar esta empresa: Como eu disse acima, por vezes, a única maneira de ensinar as pessoas é a perda de dados catastrófica, e se esse for o caso, suga para os pobres administrador que tem que assumir a culpa pela estupidez institucional.
fonte
Minha opinião pessoal é que é meu trabalho como administrador de sistemas informar e impressionar o gerenciamento sobre a necessidade e a importância de ter uma solução de backup adequada e apropriada e solicitar o orçamento necessário para isso, além de explicar os riscos associados a isso. Não é minha responsabilidade ficar "fora" do mandato da gerência e apenas fazer o que eu achar certo, independentemente de quão pobres sejam essas decisões de gerência. Não é minha responsabilidade juntar uma solução meio assada e meia assada.
Se eu era um agente de seguros e lhe disse que era importante ter cobertura contra incêndio na apólice do proprietário da sua casa, e se expliquei adequadamente o risco de não ter cobertura contra incêndio, você recusou a referida cobertura e sua casa foi incendiada. responsabilidade é? Eu deveria ter lhe dado cobertura contra incêndio de qualquer maneira?
Minha opinião é que o administrador de sistemas exerceu a devida diligência no desempenho das funções de seu trabalho, levando o assunto à atenção da gerência, explicando a importância de ter uma solução de backup apropriada, explicando os riscos de não tê-la e solicitando o orçamento necessário para tal. Se ele foi rejeitado em seus esforços, a responsabilidade recai diretamente sobre os ombros da gerência.
As pessoas tomam decisões ruins o tempo todo e coisas ruins acontecem por causa dessas decisões ruins, isso é um fato da vida. Não posso ser responsável por todas as decisões ruins que meu chefe toma, independentemente dos riscos associados a essas decisões.
fonte
A mesma situação aconteceu com a matriz RAID? Assim que um disco morre, você está em uma situação em que mais um significa perda de dados. É melhor substituir a unidade imediatamente.
Se eu estava no lugar do administrador de sistemas, no instante em que a primeira unidade foi:
Se você for negado ao longo do caminho, pelo menos você o escreverá por escrito quando a merda atingir o ventilador (receba por escrito / e-mail, não aceite uma resposta verbal. Você precisa de uma trilha em papel aqui. Se o seu gerente se recusar a escrever depois passe por cima da cabeça, porque isso é obscuro - não há razão legítima para não anotá-la.)
O mesmo processo deveria ter sido seguido para obter um sistema de backup, embora talvez sem uma escalada tão rapidamente (ou passando por cima da cabeça do seu gerente). Se nenhum dos pedidos estiver escrito, bem ... a merda rola ladeira abaixo. Pelo menos é uma boa lição de vida.
Se você não perder o emprego devido à situação, comece a fazer essa solicitação novamente, citando o desastre que causou na última vez em que a solicitação foi negada. Se ainda assim é negado, você precisa decidir se é um ambiente em que deseja trabalhar e vale a pena o estresse. Se todas as manhãs você espera entrar em trabalho, encontrando um pânico porque os dados foram perdidos, bem, isso não é maneira de viver.
fonte
A empresa está claramente procurando um bode expiatório nisso, o administrador do sistema tem toda a razão de não fazer backup de dados críticos em um dispositivo removível.
1) Eles não são confiáveis 2) Eles não são seguros
Por fim, cabe aos gerentes não garantirem que uma solução adequada de recuperação de desastres (DR) seja implementada.
Veja dessa maneira: quanto essa perda de dados custou à empresa? De repente, tenho certeza de que a solução "exagerada" não parece tão cara.
edit: sim, eu admito que qualquer backup é mais confiável do que nenhum, mas meu argumento original permanece se essa pessoa tiver gerentes, os gerentes devem garantir que o backup esteja no lugar, não estou perdoando o administrador do sistema com toda a culpa aqui, mas é isso que o gerente deve verificar.
E se o servidor falhasse e os dados nas unidades removíveis fossem irrecuperáveis por qualquer motivo? tendo ocorrido isso no passado, as unidades USB estão longe de ser confiáveis, mas, para algumas, elas podem ser usadas em uma "pitada", o problema é que, nesse caso, o gerenciamento de backup de unidade removível permitido será usado a longo prazo. corre.
fonte