Um administrador de sistemas deve fazer backup de dados importantes da maneira que puder, mesmo que não concorde com a estratégia de backup? [fechadas]

9

Recentemente, um dos principais servidores de arquivos da nossa empresa falhou. Ele estava usando uma matriz RAID de 4 discos, mas aparentemente 3 dos discos morreram e todos os dados no servidor foram perdidos.

Falando com o administrador do sistema, ele diz que está avisando a alta gerência sobre a situação do backup há meses. Ele estava tentando obter aprovação para comprar uma solução de backup em nível corporativo, mas nunca conseguiu o orçamento para isso - porque a gerência achou que estava exagerado.

O administrador do sistema é um administrador do sistema dedicado e devidamente certificado, enquanto seus gerentes não são orientados a TI.

Seu gerente está perguntando por que ele não comprou uma unidade externa barata e a usou para fazer backup do servidor de arquivos. O administrador do sistema pensa que esta é apenas uma solução mickey-mouse adequada para uso em casa, mas não uma empresa profissional de TI - e é por isso que ele não fez isso.

Parece-me que o administrador do sistema quer uma estratégia de TI adequada, de livros didáticos, que custa muito mais dinheiro, enquanto a gerência (sem um profundo conhecimento de TI) quer soluções mais baratas que julgarem adequadas.

Gostaria de saber qual é a opinião de outros administradores de sistema? Esse administrador do sistema estava correto em suas ações? Ou ele deve sempre garantir um backup dos dados importantes, mesmo que ele acredite que a maneira mais barata não seja boa o suficiente?


Editar: com base nas respostas, acrescentarei que o administrador do sistema tem um gerente de TI que saberia da situação. Ele se reporta ao chefe supremo. Não sei se o gerente relatou a situação completa ao chefe. Eu acho que é muito difícil para o gerente, pois ele está preso no meio e ele quer ser diplomático com os dois lados.

Rick
fonte
1
Parece que o administrador cortou o nariz para irritar o rosto.
Wesley
Uau. Média gerência FTL. O melhor da administração é que, na verdade, a culpa é dele . A bola pára por aí. Ele é o cara que deveria estar acompanhando o cenário geral. Ele é o cara que precisa definir alocações de orçamento e exigir capital de emergência para coisas como backups. Deve ser uma empresa pequena, se eles estão lidando diretamente com o administrador ... Onde eu trabalho, eu não falaria mais com a gerência (além do meu chefe) sobre problemas de backup do que estaria voando para a lua.
23610 Satanicpuppy
1
Sou um gerente irremediavelmente não-diplomático. Tenho sorte de trabalhar em uma empresa onde as pessoas apreciam quando você fala francamente. E para um bônus adicional, algo que qualquer pessoa que trabalhe em gerenciamento deve ler: joelonsoftware.com/articles/TwoStories.html (aplica-se a qualquer tipo de gerente, talvez o gerente em questão deva lê-lo)
Mark Henderson
Ótimo artigo, Farseeker.
Wesley5 de
Esta questão está fora de tópico sob as regras atuais de atualidade.
HopelessN00b

Respostas:

11

Concordo que fazer o que é certo é o método preferido. Mas ficar parado e não fazer nada não é profissional. A gerência foi informada de que não havia backup? É tarefa dos administradores apresentar as opções, incluindo custos e riscos, à gerência. Ele apresentou sua opção preferida e, quando foi negado, não fez nada. Não é legal.

Craig
fonte
5
Se esse cara não apresentasse pelo menos três opções para "backup corporativo", eu chamaria isso de pouco profissional. Ao mesmo tempo, se ele apresentasse as soluções "Lamborghini, Toyota & Yugo" e todas fossem derrubadas, isso seria um erro de gerenciamento.
voretaq7
3
Concordaram, desde que devidamente, formalmente, informassem que não havia backup implementado.
Craig
2
Nesse tipo de caso, pedir ao seu chefe que assine algo com o efeito "Eu entendo que estou ferrando conosco" às vezes é eficaz (além disso, como consultor, descobri que eles costumam ler quando é algo que precisam assinar).
precisa saber é o seguinte
1
Eu acho que "não é legal" pode ser apenas um pouco subestimado.
John Gardeniers
10

Eu honestamente diria que é um fracasso de ambas as partes.

A logística da situação pode significar que ele teria que gastar um tempo gasto com outras tarefas importantes e imediatas.

No entanto, em última análise, sim, ele deveria ter feito algo. Um monte de discos rígidos daqui e de lá teria sido melhor do que nada, como já foi dito repetidamente.

Por outro lado, todo o objetivo do gerenciamento é garantir que as pessoas abaixo de você possam fazer o trabalho delas. e, portanto, do ponto de vista da liderança, os gerentes falharam miseravelmente e podem ser considerados igualmente responsáveis, se não mais.

kyoung
fonte
2
+1 para a falha nas duas partes; Ainda não posso aceitar que o administrador tenha pensado melhor esperar e não fazer nada.
Maximus Minimus
+1 Concordo que foi um fracasso de ambos os lados.
IPaulo
1
+1 pela falha dupla e +1 pelo comentário de mh: a menos que a empresa fosse totalmente irracional ("você deseja fazer backups? Então você compra tudo o que é necessário para fazê-los!"), O administrador realmente estragou tudo.
precisa saber é o seguinte
4

Se não houver backups, no que me diz respeito, é responsabilidade do administrador de sistemas:

1) Diga explicitamente aos superiores que NÃO há backups, em termos inequívocos, para que eles saibam disso

2) Faça o backup dos dados de qualquer maneira, da maneira que ele puder

Francamente, eu esperaria ser demitido se isso acontecesse, porque mesmo que a administração esteja dificultando minha vida, isso não é desculpa, especialmente se eles ainda têm a impressão de que têm algo em vez de nada.

Mark Henderson
fonte
Não concordo necessariamente com o ponto 2, mas o ponto 1 é o coração do que um administrador deve fazer. Algo como "não temos backups" deve ser repetido a cada excutive pode encontrar pelo menos mensalmente até que o problema seja resolvido ...
voretaq7
E então isso acontece e quando cabeças rolar é seu no bloco ...
Mark Henderson
2
Para deixar claro, não é a parte "faça backup de qualquer maneira" que discordo, é a "maneira como ele pode": devo entrar todas as noites após o expediente e cortar manualmente os backups no meu disco rígido externo pessoal? (Algumas empresas nem vai autorizar-lhe para comprar um drive USB de 500 GB, e IMHO não há está ajudando as empresas ...)
voretaq7
4

É maldito se você faz, condenado se você não faz. Francamente, se não houve dinheiro gasto pelo gerenciamento em uma solução de backup, a culpa foi deles. Por outro lado, o administrador deveria ter sido ativo na tentativa de encontrar uma solução paliativa, em vez de apenas ficar sentado esperando que algo quebrasse (não acho que qualquer tipo de solução de unidade externa seja aceitável. você nunca pode obter um backup decente com isso.) Você não pode simplesmente dizer: "Bem, eu não tenho o que quero , por isso não sou responsável", mas você pode dizer: "Tentei repetidamente buscá-lo fazer alguma coisa e você não me deu nada e esse não é o meu problema. "

Na verdade, eu já estava em uma situação - eu nem era ADMIN nesse trabalho - onde trabalhava em um banco de dados e fiz um backup antes de alterá-lo (que é sop) e eu (como normalmente faço). , sempre que posso) salvou em minha própria máquina local. Dois dias depois, eles perderam o conjunto de ataques e, ooops, descobriram que não havia solução de backup. Eles estavam fazendo backup do banco de dados na matriz de ataque.

Então, eu chego atrasado nisso e digo: "Ah, eu fiz backup antes de ontem".

Você sabe qual foi o resultado? Fui censurado pela minha solução de backup ruim. Por uma máquina pela qual eu não era de forma alguma responsável. E não foi porque o backup que eu tinha era muito antigo, é porque eu havia feito backup apenas do banco de dados em que estava trabalhando, e não de todo banco de dados.

Portanto, o problema é o seguinte: se você faz uma solução para o mouse mickey, se faz alguma coisa e não é boa o suficiente, vai sofrer tanto como se não fizesse nada. Se os backups são de sua responsabilidade, explicitamente, e não há orçamento, você deve tentar montar algo juntos, mas é melhor garantir que funcione, e você precisa se preocupar com isso. Repetidamente. Em todas as oportunidades.

Se não é sua responsabilidade, indique que existe um problema e, absolutamente, categoricamente, se recuse a assumir a responsabilidade por um mandato não financiado quando tentarem atribuí-lo a você. Ninguém faz da recuperação de desastres uma prioridade até que ocorra um desastre, e então eles bodeiam todos para tentar compensar sua própria falta de visão.

Satanicpuppy
fonte
3

Infelizmente, as empresas que economizam nos backups são muito comuns. A maioria nunca muda até que se queime e perca tudo.

MAS

Se você trabalha para ser o administrador de sistemas, precisa trabalhar com as ferramentas disponíveis, incluindo o cérebro. Não importa o que a gerência ou qualquer outra pessoa diga em bons dias, quando o cocô atinge o ventilador, todos recebem memória seletiva.

Um backup do mouse mickey é melhor do que nenhum backup.

BhmJeep
fonte
Bravo e bis! =)
Wesley
1
Às vezes, um backup do mickey mouse é pior: todos assumem que seus dados estão seguros, mas quando o cocô atinge o ventilador, os arquivos que eles querem não são encontrados - "Ah, você salvou o disco na unidade X? Nossos backups incluíram apenas a unidade Y! " E porque "existem backups" eles não manter quaisquer cópias do seu próprio ...
voretaq7
Bem, agora isso pode ser verdade! Eu deveria ter dito backups de mickey mouse "TESTADOS". De qualquer forma, TODOS os backups devem ser testados. Alguém me disse uma vez: "Qualquer idiota pode fazer um backup, mas restaurações tomam cérebros ..." ou algo assim.
precisa saber é o seguinte
2
Do jeito que sempre ouvi, é: "Os backups não são importantes, as restaurações são importantes!"
BillN
@ BillN - Absolutamente! O responsável pelo armazenamento no último local em que trabalhei costumava detalhar as pessoas: "Se você não teve um teste de restauração bem-sucedido, não tem backup"
voretaq7
2

Para mim, parece que o administrador do sistema queria tudo ou nada. É bom ter tudo, mas se você não pode ter, não deve aceitar nada?

Na minha experiência, o que se deve fazer é avaliar todas as opções possíveis (sem muita profundidade) e elaborar alguns pontos para cada um, indicando os prós e os contras, os custos (iniciais e contínuos). Inclua aqui a opção "não fazer nada".

Então você permite que os gerentes decidam qual solução eles escolherão. Parece-me que provavelmente havia mais de uma opção possível para o seu administrador de sistemas. Talvez ele só tenha visto o que ele realmente queria?

hmallett
fonte
1
De fato. Eu sou o rei do péssimo servidor de backup de 10 terabytes, construído à mão. Salgue algumas pessoas ao redor e despeje dados regularmente. Não é tão bom quanto uma boa rotação de fita, mas uma delas custa menos do que uma caixa de fitas de tamanho decente.
23610 Satanicpuppy
1
Gigantes de RAIDs de "backup" multi-TB, tratando discos rígidos USB como "fitas", fazendo backup na rede para rsync.net, usando o tarsnap.com - sempre há algo desde que o orçamento não seja $ 0 (e às vezes você pode até se contentar com $ 0 :-)
voretaq7
2

Vou acrescentar minha voz àqueles dizendo que o administrador deveria ter implementado algo aqui. Ele é muito culpado por não ter feito isso. Há uma parte de mim que gostaria de simpatizar com sua posição, mas em um mundo ideal, o backup e a restauração não levariam tempo, sempre funcionariam e nunca seriam necessários. Esse não é o mundo e até a melhor solução de backup terá falhas que você precisará aceitar e aprender a trabalhar.

Meia-bunda é melhor do que não-bunda, e mesmo usando um USB HD el-cheappo o teria tirado da floresta, e teria dado peso à sua posição quando a gerência é informada de que eles não podem obter dados mais do que o dia ou dois anos atrás. Mas isso ainda teria salvado seu pescoço neste caso.

Maximus Minimus
fonte
E, em um caso extremo, talvez até salve a empresa e os empregos de todos. Mais de uma empresa faliu como resultado da perda de dados.
John Gardeniers
2

Um administrador de sistemas deve fazer backup de dados importantes da maneira que puder.

Não sei se diria que você deve fazer um backup sob quaisquer condições . Há algumas coisas que você pode ser tentado a fazer que possivelmente seriam ilegais. Por exemplo, eu não faria backup de registros de saúde pela rede para o meu computador pessoal. Eu não faria algo ilegal apenas para ter um backup.

OTOH para ter pelo menos algum sistema de backup em funcionamento, eu aceitaria muitos compromissos. Então, sempre que um compromisso era feito, eu fazia questão de garantir que minhas objeções fossem claras e documentadas sobre por que era um compromisso ruim que causaria problemas, seria inadequado ou se tornaria menos útil no futuro.

Zoredache
fonte
1

Como administrador de sistemas, acredito que seja minha responsabilidade garantir que os sistemas sob meus cuidados sejam os mais seguros e confiáveis ​​possíveis. Os backups se enquadram nas tags de confiabilidade. Por mais frustrante que seja ter que discutir com funcionários seniores que não entendem (acho que todos já estivemos lá em algum momento ou outro), ainda deveríamos estar fazendo nosso trabalho da melhor maneira possível.

Quando o sistema de backup que herdei na minha posição atual falhou e a gerência hesitou em gastar o dinheiro no sistema que queria, não o deixei sem backups. Em vez disso, trouxe minha unidade externa pessoal e a usei por mais ou menos uma semana. Apesar de ter uma aversão absoluta ao usar discos rígidos para backups, permanece o fato de que era muito preferível a não ter nenhum.

John Gardeniers
fonte
Uau. Acessórios para trazer suas próprias coisas. Não sei se teria ido tão longe. Às vezes, vejo cruzar a linha entre o pessoal e os negócios como O Último Grande Mal. No entanto, talvez seja o penúltimo grande mal, ao lado de ficar na fila do desemprego Atualizando seu currículo sem nenhuma referência do seu último empregador.
Wesley5
Quando você é um "departamento" de TI, você tende a ser um pouco mais flexível do que trabalha para uma organização maior. Quanto à linha entre negócios e pessoal, acho que é mais uma mancha cinza realmente larga do que uma linha divisória clara.
John Gardeniers
1
Eu sou uma loja de TI de um homem sem fins lucrativos que gastou mais dinheiro em 2009 do que eles receberam ... e eu / ainda / não trago minhas próprias coisas. Talvez eu seja um idiota? : - /
Wesley
Admito que usei alguns dos meus próprios equipamentos (por exemplo, tenho cópias de nossas chaves de criptografia de backup em um arquivo (criptografado) no pen drive em minhas chaves). Para mim, a linha é "Se isso for absolutamente necessário para o negócio a funcionar, a empresa precisa para fornecê-la"
voretaq7
1
Acredite, se a unidade externa fosse necessária por mais de alguns dias, eu não teria continuado a usar a minha. Isso foi puramente uma medida de "gap-stop". Informar a gerência que eu a estava usando provavelmente ajudou a obter a aprovação para comprar o que era necessário.
John Gardeniers
0

Se o administrador do sistema não conseguiu convencer o gerenciamento da importância de uma boa solução de backup, a única maneira de convencê-lo é através da perda de dados catastrófica, mas como administrador do sistema, é sua responsabilidade educar o gerenciamento e os usuários sobre a importância de coisas como backup , e para garantir que eles entendam completamente o estado atual (neste caso, "sem backups") e as possíveis consequências ("Perdemos um disco e seus dados preciosos desaparecem para sempre").

Minha opinião pessoal é que o administrador meio que estragou tudo aqui: backups ad-hoc são uma má idéia (você perderá coisas, dados importantes serão perdidos, se você não estiver por perto, os backups não acontecerão), mas ao mesmo tempo tempo, eles deveriam ter conseguido encontrar uma solução de backup "corporativa" confiável dentro do orçamento da empresa.
Programas como Bacula e Amanda estão disponíveis gratuitamente, e ambos podem funcionar com mídia removível e CDs USB de maneira segura e confiável. Incluindo o custo de mídia e hardware do servidor, você pode ter um bom sistema por menos de US $ 2000 - ainda mais barato se reciclar o hardware do servidor.

Agora, se a gestão também se opõe à despesa de administração TEMPO em obter apoios trabalhando há apenas não ajudar esta empresa: Como eu disse acima, por vezes, a única maneira de ensinar as pessoas é a perda de dados catastrófica, e se esse for o caso, suga para os pobres administrador que tem que assumir a culpa pela estupidez institucional.

voretaq7
fonte
Eu acho que o administrador do sistema estava pensando nessas linhas de antemão, que seria necessário uma perda catastrófica para ensinar a eles a necessidade de uma estratégia de backup adequada. Agora que aconteceu, eu sei que ele está bem estressado.
1076 Rick
O problema é que, como administrador, você não pode confiar na dor para ensinar: Sim, provavelmente ele receberá um sistema de backup assim que o incêndio terminar, mas todos se lembrarão de que perderam dados no relógio dele e isso prejudica a empresa (pelo menos A curto prazo).
precisa saber é o seguinte
0

Minha opinião pessoal é que é meu trabalho como administrador de sistemas informar e impressionar o gerenciamento sobre a necessidade e a importância de ter uma solução de backup adequada e apropriada e solicitar o orçamento necessário para isso, além de explicar os riscos associados a isso. Não é minha responsabilidade ficar "fora" do mandato da gerência e apenas fazer o que eu achar certo, independentemente de quão pobres sejam essas decisões de gerência. Não é minha responsabilidade juntar uma solução meio assada e meia assada.

Se eu era um agente de seguros e lhe disse que era importante ter cobertura contra incêndio na apólice do proprietário da sua casa, e se expliquei adequadamente o risco de não ter cobertura contra incêndio, você recusou a referida cobertura e sua casa foi incendiada. responsabilidade é? Eu deveria ter lhe dado cobertura contra incêndio de qualquer maneira?

Minha opinião é que o administrador de sistemas exerceu a devida diligência no desempenho das funções de seu trabalho, levando o assunto à atenção da gerência, explicando a importância de ter uma solução de backup apropriada, explicando os riscos de não tê-la e solicitando o orçamento necessário para tal. Se ele foi rejeitado em seus esforços, a responsabilidade recai diretamente sobre os ombros da gerência.

As pessoas tomam decisões ruins o tempo todo e coisas ruins acontecem por causa dessas decisões ruins, isso é um fato da vida. Não posso ser responsável por todas as decisões ruins que meu chefe toma, independentemente dos riscos associados a essas decisões.

joeqwerty
fonte
0

A mesma situação aconteceu com a matriz RAID? Assim que um disco morre, você está em uma situação em que mais um significa perda de dados. É melhor substituir a unidade imediatamente.

Se eu estava no lugar do administrador de sistemas, no instante em que a primeira unidade foi:

  1. Gerenciador de email com solicitação formal para substituir a unidade, lembrando que nenhum sistema de backup foi aprovado; portanto, essa é uma situação crítica. Cite as solicitações anteriores do sistema de backup anexando esse email, ou melhor ainda, a resposta do gerente que nega a solicitação.
  2. Se não houver resposta, reenvie a mensagem, desta vez controlando o gerente do seu gerente.
  3. Se ainda não houver resposta, bem .. não muito mais você pode fazer. Polir o currículo e começar a procurar um emprego melhor.

Se você for negado ao longo do caminho, pelo menos você o escreverá por escrito quando a merda atingir o ventilador (receba por escrito / e-mail, não aceite uma resposta verbal. Você precisa de uma trilha em papel aqui. Se o seu gerente se recusar a escrever depois passe por cima da cabeça, porque isso é obscuro - não há razão legítima para não anotá-la.)

O mesmo processo deveria ter sido seguido para obter um sistema de backup, embora talvez sem uma escalada tão rapidamente (ou passando por cima da cabeça do seu gerente). Se nenhum dos pedidos estiver escrito, bem ... a merda rola ladeira abaixo. Pelo menos é uma boa lição de vida.

Se você não perder o emprego devido à situação, comece a fazer essa solicitação novamente, citando o desastre que causou na última vez em que a solicitação foi negada. Se ainda assim é negado, você precisa decidir se é um ambiente em que deseja trabalhar e vale a pena o estresse. Se todas as manhãs você espera entrar em trabalho, encontrando um pânico porque os dados foram perdidos, bem, isso não é maneira de viver.

gregmac
fonte
2
Uma vez eu tinha uma matriz de 12 discos e recebi um aviso de que uma unidade estava indo para o sul. Então eu coloquei uma nova unidade e disse à matriz para reconstruí-la. Durante a reconstrução, outra unidade começou a falhar e depois outra. No final, eu tinha 10 das 12 unidades começando a falhar e eu tinha substituído todas as 12 por paranóia. NÃO é incomum perder várias unidades em um ataque. NÃO é impossível perder o ataque em si, sem qualquer falha nas unidades. RAID não é uma solução de backup.
23610 Satanicpuppy
Muitas vezes, o ato de iniciar uma reconstrução de RAID (especialmente em matrizes antigas) causará erros de software suficientes em uma ou mais das unidades restantes para que o controlador RAID declare a unidade "com falha" e BAM! Lá vão seus dados.
precisa saber é o seguinte
-3

A empresa está claramente procurando um bode expiatório nisso, o administrador do sistema tem toda a razão de não fazer backup de dados críticos em um dispositivo removível.

1) Eles não são confiáveis ​​2) Eles não são seguros

Por fim, cabe aos gerentes não garantirem que uma solução adequada de recuperação de desastres (DR) seja implementada.

Veja dessa maneira: quanto essa perda de dados custou à empresa? De repente, tenho certeza de que a solução "exagerada" não parece tão cara.

edit: sim, eu admito que qualquer backup é mais confiável do que nenhum, mas meu argumento original permanece se essa pessoa tiver gerentes, os gerentes devem garantir que o backup esteja no lugar, não estou perdoando o administrador do sistema com toda a culpa aqui, mas é isso que o gerente deve verificar.

E se o servidor falhasse e os dados nas unidades removíveis fossem irrecuperáveis ​​por qualquer motivo? tendo ocorrido isso no passado, as unidades USB estão longe de ser confiáveis, mas, para algumas, elas podem ser usadas em uma "pitada", o problema é que, nesse caso, o gerenciamento de backup de unidade removível permitido será usado a longo prazo. corre.

Oneiroi
fonte
6
A ausência de um backup é ainda mais confiável do que um backup não confiável. Veja as respostas de Farseeker e Craig para obter mais informações.
234 Wesley Wesley
+1 para Wesley - backups não confiável / ad-hoc irá mordê-lo (e Murphy diz que você vai perder o mais importante 1% dos dados quando o fazem), mas pelo menos você ainda tem os outros 99% ...
voretaq7
Não tenho certeza se entendi seu segundo ponto. Quase nenhuma mídia de backup é segura por si só. Se você ativar a criptografia no software de backup, o backup será seguro. Um volume simples de truecrypt em uma unidade portátil oferece segurança adequada. Seu primeiro ponto é igualmente fraco. Nenhuma mídia de backup é 100% confiável, todas elas podem falhar. Um backup em um disco rígido portátil não pode ser pior do que nenhum backup, se a segurança adequada for implementada.
Zoredache
@ Oneiroi - isso está errado em muitos níveis. Eles podem não ser tão confiáveis ​​e seguros quanto um backup adequado, é o que eu espero que você queira dizer, mas mesmo assim, quando a alternativa não é um backup, eu não acho que assumir uma posição alta e poderosa por uma questão de argumentar seja vai cortá-lo no mundo real.
Maximus Minimus