Eu tenho um servidor Netware 3.12 da época de 1998 que executa tudo em nosso campus: contabilidade, compras, folha de pagamento, informações de alunos, notas, etc. O servidor possui um controlador RAID Adaptec com dois volumes:
- RAID 1, 2 discos SCSI de 17 GB, Seagate ST318417W
- RAID 5, 3 discos scsi de 4 GB, 2 Seagate ST34573W e 1 ST34572W.
Atualmente, estamos nos estágios iniciais de um projeto para substituir esse sistema, mas você não entra em um novo sistema como esse e, portanto, preciso manter esse servidor em execução até pelo menos novembro de 2011.
Nesta semana, tivemos um, mas dois discos rígidos falharam. Felizmente, eles são de volumes diferentes e somos capazes de continuar funcionando por um momento, mas, dada a natureza próxima dessas falhas, tenho sérias dúvidas de que poderei evitar falhas catastróficas deste servidor até o destino de novembro, sem restaurando a redundância de RAID - serão necessárias apenas mais uma falha de unidade em qualquer lugar e eu estou completamente conectado.
Temos a sorte de ter "peças sobressalentes" de correspondência exata nas duas unidades, mas as peças estão em condições desconhecidas. Tentei trocar apenas eles, mas o controlador RAID não é inteligente o suficiente para lidar com isso e torna o sistema não inicializável.
Quanto ao próprio controlador RAID, existe um utilitário no qual posso entrar durante o POST através de um atalho Ctrl-A, mas não posso fazer muita utilidade a partir daí. Para realmente gerenciar volumes, primeiro devo inicializar no Netware, momento em que posso usar CI/O Array Management Software Version 2.0
para realmente examinar as informações de volume. Suspeito que a maneira normal de gerenciar as coisas seja inicializar a partir de um disquete especial com o software do controlador, mas esse disquete se foi há muito tempo.
Percorrendo as opções do software RAID, acho que a única maneira suportada de substituir um disco em um volume RAID existente é adicionar fisicamente o disco, inicializar e configurá-lo como um "sobressalente" para um volume, forçar o uso do volume o sobressalente para substituir um disco inoperante existente (e, neste momento, estou apenas supondo) para que o disco inoperante se torne um sobressalente, repare o volume, remova o sobressalente do volume e, em seguida, desligue e remova o disco. Em seguida, comece tudo de novo para o outro disco com falha. Tudo isso equivale a muito tempo de inatividade, supondo que eu possa fazê-lo funcionar e que minhas peças de reposição sejam boas.
Quanto a encontrar peças de reposição confiáveis, não tenho idéia de onde começar a procurar uma nova unidade scsi de 4 GB, ou mesmo o sistema scsi exato que estou procurando, pois ele passou por algumas iterações diferentes ao longo do tempo.
Outra opção é migrar isso para uma máquina virtual (hyper-v), mas todas as tentativas anteriores que fizemos nessa área não foram muito longe. Quando esta máquina foi instalada, eu estava terminando o ensino médio e, portanto, exige um conhecimento mais baixo de netware e dos do que jamais desenvolvi, ou se eu já havia esquecido (também não sou exatamente um dos neófitos).
Parte do meu problema é que este é um servidor de alto uso, e retirá-lo por alguns dias para descobrir as coisas não vai funcionar muito bem.
Quanto à pergunta, estou procurando qualquer coisa que possa ser útil nessa situação: uma recomendação sobre um local para encontrar boas peças de reposição dessa época, experiência pessoal reparando volumes RAID usando um controlador semelhante ou criando um hyper-v vm a partir de um servidor netware antigo, uma linha em um disquete com software melhor para o controlador RAID, recomendação para um bom consultor da Novell em Nebraska que seria capaz de corrigir as coisas, uma opção totalmente diferente que eu ainda não considerei etc.
Atualização:
para backups, temos bons backups (verificados recentemente via restauração) apenas dos dados - nada para o software que realmente executa as coisas.
Atualização 2:
Apenas um relatório de progresso de que atualmente tenho uma instalação do Netware 3.12 em funcionamento no VMWare Virtual Server 2.0, em grande parte graças ao guia que encontrei aqui:
http://cerbulescubogdan.blogspot.com/2010/11/novell-netware-312 -on-vmware.html
As próximas etapas são a preparação de volumes vazios de netware para corresponder aos volumes adicionais no meu servidor existente, fazendo um despejo de tudo nos volumes C: \ drive e netware no servidor existente e descobrindo a partir dessas informações quais módulos precisam ser adicionados ao netware, instalando minhas licenças (ainda temos esse disco, se for bom) e movendo os dados.
Eu tenho aprovação para desativar o servidor por uma semana após o primeiro do ano (infelizmente não antes), portanto, além de criar volumes vazios, o restante do trabalho terá que esperar até então.
Atualização final (5 de janeiro de 2011):
Consegui obter peças sobressalentes trabalhando em ambas as matrizes de invasões sem perda de dados esta semana. Agora, ambos são listados pelo controlador como "FAULT TOLLERANT" (yay!). Também pude aproveitar o progresso da minha última atualização e agora tenho um servidor "sobressalente" funcional no VMWare Server 2.0. O sobressalente pode executar e usar nosso software erp, mas não posso colocá-lo em produção porque ainda não consigo imprimir a partir dessa caixa (e não faço ideia do porquê). Mesmo assim, essa VM funcionará muito bem se eu não tiver outra escolha, e entre ela e as matrizes RAID reparadas, eu me sinto confortável vivendo com a situação até poder colocar a máquina em lixo em novembro.
Epílogo (16 de janeiro de 2012):
O projeto para substituir este servidor por um sistema totalmente novo entrou em operação conforme planejado. Hurrah para não mais netware! Todos saudam o Sql Server! O rei está morto. Vida longa ao rei!
Ainda planejamos manter o servidor antigo em funcionamento por mais algum tempo, até que a auditoria pós-ano fiscal seja concluída em agosto. Mas se um fracasso acontecer de vez em quando, ninguém reclamará muito.
Respostas:
Obtenha (e continue a obter, diariamente ou com mais frequência) bons backups dos dados do arquivo compartilhado agora . Se você perder a máquina, provavelmente não conseguirá encontrar os disquetes necessários (sim) para restaurá-la. Obtenha uma cópia da partição DOS da qual o Netware inicializa, se possível também.
Isso soa como uma placa RAID Adaptec AAA-131 (ou algo da época). Se eu estiver certo, você não encontrará um software de gerenciamento muito melhor porque não existe (consulte http://www.adaptec.com/en-us/downloads/novell_netware/novell_netware/productid=aaa-131&dn=aaa-131 .html para as últimas versões disponíveis). Eu usei muitos desses cartões "antigamente" e eles funcionaram bem.
Se for um AAA-131, tenha muito cuidado ao brincar com sua configuração . Não há como configurar um conjunto de RAID sem limpar os discos nessas placas. Isso significa, por exemplo, se você desmontar a caixa e anexar alguns discos de teste e, digamos, limpar a configuração e definir um RAID, quando você reconectar os discos de "produção", não haverá como usá-los sem o cartão formatá-los primeiro. Sim. Isso é ruim.
O Novell Netware será executado nos hipervisores VMware. Eu recomendo contratar alguém que tenha uma experiência decente em Novell Netware (há pessoas aqui - estou olhando para você, Sysadmin1138-- que possui) para ajudá-lo a transferir o conteúdo do servidor para um ambiente virtual em que , pelo menos, você pode continuar.
Se os computadores dos seus clientes forem modernos e tiver um cliente de rede da Microsoft instalado, você poderá descobrir que a migração para uma máquina baseada no Windows Server seria realmente rápida e fácil. Crie a máquina Windows Server com o mesmo nome que o servidor Netware, exponha uma estrutura de diretórios compartilhados com a mesma convenção de nomenclatura UNC que a máquina Netware, copie todos os arquivos e duplique as permissões na máquina de destino (manualmente). Pode não ser tão difícil de fazer e você pode "preparar" a migração em um laboratório de teste com antecedência e testar alguns clientes com ela para decidir o que precisa ser alterado da perspectiva do script / ambiente do usuário.
Provavelmente você pode obter algum hardware sobressalente no eBay. Tudo o que você comprar dessa safra também terá problemas de confiabilidade.
Se eu fosse você, estaria contratando alguém bom com o Windows Server para ajudá-lo a organizar uma migração para longe dessa caixa AGORA . Provavelmente, o caso pode ser levado à gerência para gastar algum dinheiro, pois você pode perder todo o conteúdo da caixa do Netware praticamente a qualquer momento. A caixa de substituição não precisaria de potência enorme (considerando o que você está substituindo), portanto, o licenciamento e o backup do software seriam seus maiores custos. Os problemas de migração relacionados ao cliente podem ser minimizados usando um consultor que seja bom com scripts e possa planejar os detalhes da alteração das configurações relacionadas ao cliente através de scripts de logon e inicialização.
fonte
Eu sei, porque eu fiz (oi Evan), que o VMWare tem suporte decente ao NetWare. Mesmo para as coisas realmente antigas (o que você está executando). O NetWare desse NOOPs vintage da CPU quando ocioso, em vez de HALTing, portanto, qualquer CPU que for fornecida em uma VM será vinculada. É para isso que servem as VMWare Tools, elas não fazem isso. O VMWare existe desde os anos 90 (e até tem um estande na BrainShare há vários anos) e teve que fazê-lo, é por isso que eles têm suporte. A virtualização da Microsoft é nova o suficiente para que eles nunca tenham virtualizado o NetWare; portanto, não funciona lá.
Se esse servidor for tão crítico quanto você diz, é fácil vender algumas licenças do VMWare. No mínimo, prima por uma licença da Estação de Trabalho VMWare, que ao menos levará esse servidor a um ambiente virtual. O VMWare Server é gratuito (eu acredito) se você realmente precisar. Depois que esse trabalho estiver concluído, você poderá movê-lo para algo como o ESXi até que ele possa ser substituído formalmente.
Existem outras opções, dependendo das suas habilidades no Linux. A Novell passou algum tempo recebendo o Xen (não o KVM, o Xen, embora ambos usem o qemu) para dar suporte ao NetWare. Provavelmente funcionará com o NW3.12, embora você precise ter certeza de que usa o modo de virtualização completo , não a paravirtualização.
Esse servidor é novo o suficiente e deve ter uma unidade de CD-ROM, o que provavelmente será sua graça salvadora. Depois de concluir o backup, inicie-o em um ISO-Linux, se desejar. Ele não conseguirá acessar os dados, mas deverá ver o disco rígido. Nesse ponto, faça uma
dd
cópia completa dos dois volumes para outro lugar da sua rede. Essas imagens de unidade podem ser usadas diretamente pelo qemu como unidades virtuais.Existem maneiras de converter imagens geradas por dd em VMware VMDK, mas eu não as usei. Pesquise no Google, eles estão lá fora.
fonte
Isso não é realmente útil em termos de sua pergunta (francamente, você já tem peças de reposição, e a única sugestão útil que eu tenho para fornecer discos antigos seria " Alimente os números de modelo de unidade ao Google Shopping "), mas antes de tocar em qualquer outra coisa você realmente deve ter certeza de que possui um bom backup e pode restaurá-lo com êxito em uma nova máquina em um estado utilizável .
Se esta máquina é tão crítica quanto parece na sua descrição, essa deve ser sua prioridade zero agora. Se você não tiver realizado um teste de restauração bem-sucedido em seus backups há algum tempo, deve presumir que eles não valem nada e precisa garantir que você possa realmente se recuperar se a máquina chiar pela última vez e morrer em você.
Se outro disco cair sobre você e você não tiver backups utilizáveis, esse é o jogo. Você estará migrando para o seu novo sistema imediatamente, esteja pronto ou não.
Apenas meus $ 3,50.
fonte
Outros já abordaram backups, etc., então não repetirei nada disso. Existem algumas coisas que você pode fazer para melhorar suas chances de o sistema continuar funcionando.
Comece investindo em um filtro de linha de boa qualidade e coloque-o entre o no-break e o servidor. Esses discos antigos agora serão bastante sensíveis a surtos, picos e até pequenas flutuações de oferta.
Vejo que você atualiza que você já instalou as unidades sobressalentes, mas é o que eu recomendaria: Antes de tentar as unidades sobressalentes no servidor, coloque-as em outra máquina e enfatize a porcaria delas com o software de queima ou, se você não pode se apossar disso, ciclos de teste contínuos usando um software de teste de unidade regular. Mantenha isso por pelo menos alguns dias antes de declarar as unidades confiáveis. As unidades antigas que estavam armazenadas são notoriamente não confiáveis e podem falhar rapidamente.
fonte
Excelentes sugestões acima. Tente isso também - em hardware moderno sobressalente, tente fazer uma recuperação de todo o sistema a partir do seu último backup completo. Verifique se a máquina sobressalente não está na rede.
O que é isso, eu temo que você possa dizer? Você não possui backups e / ou um procedimento de restauração? Bem, agora você sabe no que está trabalhando na próxima semana?
fonte
Responder apenas a duplamente / triplicar / quadruplicar recomenda fazer um backup todos os dias até você descobrir uma solução. Se você não pode substituir facilmente as unidades mortas, sua única solução é migrar para novas unidades. Se isso significa construir um novo servidor ou migrar lentamente o servidor existente para usar novas unidades no servidor existente, é a única opção.
Tivemos 2 de 3 discos rígidos com falha em uma única noite em um array RAID 5 de 7 anos. Nossos backups estavam desatualizados. 8 dias e US $ 17.000 depois, uma empresa de recuperação de dados conseguiu recuperar todo o servidor Exchange, mas ninguém ficou satisfeito. (Exceto eu, porque eu deveria fazer backups todos os dias. No hardware que solicitei, mas ninguém compraria para mim, mas esse fato foi perdido para todos os outros ...)
A única coisa boa a sair disso foi que o cliente aprovou imediatamente minha solicitação de compra de 6 meses para substituição de hardware. Mas, caramba, foram 8 dias extremamente estressantes. Faça um favor a si mesmo, faça um backup agora e comece a trabalhar em um plano de backup de contingência "instale e execute qualquer hardware que você possa encontrar no seu escritório" agora.
fonte