O RAID 0 é tão arriscado quanto as pessoas dizem?

9

Estou prestes a configurar meus discos rígidos com RAID 0. É realmente tão arriscado quanto as pessoas dizem?

hard-drive raid charlatão quixote
fonte

22

O RAID 0 dobra sua chance de falha de armazenamento (assumindo um Raid 0 de 2 discos). Por quê? Porque agora você conta com a confiabilidade de 2 discos, em vez de apenas um.

O RAID 10 traz de volta um nível razoável de confiabilidade.

kmarsh
fonte

RAID10 é apenas um nível "razoável" de confiabilidade?

214 Josh Josh

52

@ Jos: Sim. O Fire não verifica o nível de RAID que você configurou no seu servidor.

@womble +1 - que é bastante divertido :)

Coops

2

Obrigatório "RAID não é um backup." Fogo, fogo, fogo!

Bratch 04/11/2009

2

@ womble: Seu comentário é mais votado que esta resposta, e a pergunta combinada.

Macha

8

RAID 0 significa redundância ZERO. Sempre que há dados a serem gravados no dispositivo RAID, eles são divididos em dois, a primeira parte é gravada no primeiro disco, a segunda parte no segundo, o que torna sua operação de gravação muito rápida. Mas se um dos discos quebrar, todos os seus dados serão perdidos (uma vez que você perde (aproximadamente) 50% de todos os seus arquivos, tornando-os inúteis)

soulmerge
fonte

8

Para esclarecer "perca 50% de todos os seus arquivos" ... Metade de cada arquivo é perdida; você não pode recuperar 50% do número de arquivos que possui. Embora alguns serviços caros de reconstrução de dados possam chegar bem perto ... às vezes.

Tsilb

ahh é assim que você se lembra qual é qual! duh

Simon

7

Sim. Se você perder apenas uma unidade na matriz, perderá tudo. O que significa que qualquer coisa no RAID 0 deve ter um backup .

Josh
fonte

17

Mesmo se estiver usando algo diferente de RAID 0, você ainda deve ter backups.

Juliano

3

Sim, veja também: serverfault.com/questions/2888/why-is-raid-not-a-backup

ThatGraemeGuy

@ Juliano, sim, você está certo. Eu acho que se você tem RAID 0, "absolutamente absolutamente realmente realmente deve ter backups"?

Josh

2

Se você não "confia absolutamente absolutamente absolutamente" no seu backup, ele não é um backup. O ponto do backup é restaurar. Se você não está testando isso e com certeza do sucesso da restauração, não é um backup.

Evan Anderson

1

RAID não é um backup. Tudo o que você não fez uma restauração de teste não é um backup. Qualquer coisa vulnerável às mesmas coisas que seu armazenamento principal não é um backup. E, sim, o RAID0 falhará mais do que outro armazenamento.

David Thornley

6

Depende do que você está usando. Como outros já disseram, dobra aproximadamente o risco de falha dos dados contidos em comparação com um único disco. Se você tinha 3 discos no ataque 0, então 3x o risco, etc ... Isso ocorre porque você perde quase todos os dados se algum disco falhar. O RAID opera em um nível baixo, portanto, geralmente não coloca um arquivo em um disco e outro arquivo no outro disco , mas geralmente divide o arquivo entre os discos que tiverem.

No entanto, se você tiver um backup e forem dados estáticos, e o tempo de atividade não for realmente importante, não será perigoso . Por exemplo, eu posso usar o raid 0 em uma máquina de jogos com meus arquivos salvos em outro disco. Dessa forma, as cargas de nível serão rápidas :-) Mas, para usos apropriados de TI, não é a escolha ideal.

Uma situação de TI seria máquinas redundantes com dados estáticos. Nesse caso, não há problema em uma máquina cair por um tempo.

Por fim, os discos rígidos são mecânicos e quebram com bastante frequência . Talvez você não veja isso se tiver apenas alguns desktops, mas com uma sala de servidores e muitos discos, você os substituirá com bastante frequência.

Kyle Brandt
fonte

Eu sou relativamente novo aqui, e "serverfault" não está no meu dicionário, então eu tenho que perguntar: o que é isso: "serverfault Situation", "serverfault Usos apropriados". A falha do servidor é como ser um olheiro ou algo assim? Temos distintivos? Estamos sempre preparados? Essa linguagem é estranha para mim.

Labradort

Oh, desculpe. Bem, existe um superusuário para usuários do tipo Desktop e Serverfault para administradores de sistema. Então, quando eu disse serverfault, eu quis dizer TI ou em larga escala. Veja o link faq no canto superior direito desta página.

Kyle Brandt

3

Sim. você tem 2 discos, ataque 0 - se um falhar, todos os dados serão perdidos. se você não usar o ataque - se 1 falhar, 50% dos dados serão perdidos ...

SE você usa o ataque 1 - se 1 falhar - você tem 0% de dados perdidos, mas paga duas vezes pelo seu hardware .... :-)

Dani
fonte

3

Falando da experiência pessoal de perda de dados, eu recomendaria definitivamente que você evite as dores de cabeça e evite o RAID 0. Para cada unidade na matriz, você aumenta as chances de perder todos os dados. Eu tinha três unidades no RAID 0 e a unidade intermediária quebrou apenas alguns meses depois, perdendo quase 1 TB de dados.

Drarok
fonte

4

Minha experiência foi que, se uma unidade falhar, as outras estão prestes a ir também. Portanto, não me preocupo muito com o RAID 0. Basta fazer seus backups. Perdi 2 unidades de uma matriz RAID 5 de 4 unidades no mesmo dia, reconstruí-a e perdi uma terceira unidade original uma semana depois ... Se possível, evite unidades da mesma idade, do mesmo lote em matrizes RAID de qualquer tipo? :-)

Brian Knoblauch

@ Brian, esse é um ótimo ponto no final. Tivemos 17 falhas de unidades em vários dispositivos SAN trabalhando no mesmo dia. Eles tinham a mesma idade e lote de dispositivos.

21480 David Davidman

@ Brian Knoblauch: Eu não entendo completamente o seu ponto: como você não pode se preocupar com o RAID0 só porque, se um disco falhar, os outros logo o farão? Com RAID1, RAID5 ou RAID10, se uma unidade falhar, você não perderá dados. Com o RAID0, você perde todos os seus dados. Não importa se as outras unidades estão prestes a sair ... Quero dizer, obviamente, importa na medida em que planeja substituir as outras em breve ... mas com o RAID0, você perde tudo. As outras unidades em breve não afetam isso.

Josh

@ Josh: Eu acredito que o ponto dele é que você precisa de backups, não importa o quê. Observe que a perda de duas unidades do RAID 5 também perde dados, o que não é seguro. Dito isto, parece que o uso de unidades da mesma idade no RAID 0 pode ser razoável, mas substitua as duas se uma unidade falhar.

David Thornley

1

Eu não acho que o Raid 0 é arriscado. Eu pessoalmente corro o raid 0 para o meu sistema operacional para obter uma velocidade beneficiada. Você pode usar minha configuração de ataque a qualquer hora do dia e eu não perderia nada. Eu tenho meu sistema configurado corretamente, para obter os benefícios da velocidade e ter pouca ou nenhuma perda de dados possível.

O único risco é para pessoas que não sabem como distribuir riscos.

Posso dizer o que foi dito acima, porque simplesmente trabalho apenas em arquivos importantes em outra unidade, além da usada para manter meu sistema operacional. Eu instalo aplicativos e outras coisas na minha unidade principal do sistema operacional, mas seus arquivos de configuração e outros estão em uma unidade secundária. Essa unidade secundária é então espelhada para outra unidade e eu faço backups semanais desse espelho para uma unidade externa. Se meu Raid 0 (OS Drive) falhar, basta puxar o drive / s e colocar outro. Pegue um CD ao vivo do Linux e use um programa como dd ou cat para copiar uma imagem já criada nas unidades de ataque. . Eu reinicio e agora meu sistema está de volta a um estado intocado.

Recursão
fonte

0

Em 99% dos casos, o RAID-0 provavelmente será uma má idéia por todos os motivos mencionados por outras pessoas (maior chance de falha completa, etc.).

No entanto, pode ser usado em algumas situações (mais extremas), por exemplo, em uma grande variedade de servidores trabalhando juntos (à la google), onde falhas individuais de máquinas não afetam criticamente a saída final, mas o RAID-0 é rápido e barato. maneira de expandir a capacidade.

Mas, para ser brutalmente honesto e não tentar ser mau, mas se você está fazendo essa pergunta, não estará no último grupo de administradores de servidor :)

Cooperativas
fonte

0

Muitos caras falam sobre probabilidade e estão enganados! Se você deseja o risco de usar o ataque 0, é assim que é calculado.

Suponha que a probabilidade de falha de hard1 seja p1 (em nossa unidade de período de tempo) e hard2 seja p2 quando houver um circuito em série, porque falhar em um hard quebrará o circuito.

Portanto, para calcular o risco, temos: risk = (1-p1) * (1-p2)

Por exemplo, se as probabilidades de falha hard1 e hard2 forem 0,001, o risco será: 0,998001

Portanto, como você vê, a falha de 2 discos rígidos é quase a mesma que a probabilidade de 1 falha no disco rígido que não é muito alta.

Mas há algo mais aqui que muda a situação e que você não pode recuperar arquivos de discos rígidos quebrados com muita facilidade, na verdade, na minha experiência, é impossível.

Ehsan.b
fonte

2

(1-p1) é a chance de funcionar ok. Sua multiplicação (1-p1) * (1-p2) é a alteração de ambos os dispositivos funcionando bem.

Kolypto #

1

Mais cedo ou mais tarde, cada unidade falhará. Não é uma questão de se, mas quando. Portanto, como você não indicou um período para tornar os cálculos significativos, a probabilidade pode ser apenas 100%.

1

Sem mencionar que, para baixas chances de falha, a chance de um dos dois discos falhar é quase o dobro da chance de um. .999 não é quase o mesmo que .998001, se você começar a arriscar a falha repetidamente.

David Thornley

3

E as probabilidades não são independentes, pois os dois discos provavelmente são os mesmos e funcionam no mesmo ambiente. Então você não pode simplesmente multiplicar valores.

liori 5/11/2009

eu acho que esta é apenas a probabilidade de que ambos não conseguem, ao mesmo tempo ...

ultrajohn

0

O fator de risco do uso de um RAID 0 depende muito do que você vai usar.

Quanto à minha experiência, comecei a usar o RAID 0 há um ano usando 2 discos baratos para melhorar o desempenho em jogos e algumas edições de vídeo e 1 disco rígido grande para armazenamento simples. Eu mantenho todos os meus dados importantes em backup onde considero seguros.

O que farei se um (ou ambos) discos morrerem em mim? Eu tenho uma imagem do SO com todos os meus programas e drivers instalados, então jogarei o disco com defeito, utilizarei o outro até que ele morra como seu irmão, compre alguns novos e construa a matriz e procede a deixar meu computador como eu quero.

LaughingMan
fonte

0

Acredito que o raid5 oferecerá alguns dos benefícios do raid0 e do raid1, para que você obtenha maior velocidade e redundância em comparação ao uso de apenas uma unidade. No entanto, são necessários três discos no mínimo.

Fred
fonte

2

Observe que o raid5 é muito ruim em gravações aleatórias, pois você precisa fazer 3 IOs (uma leitura e duas gravações) para atualizar um único bloco isolado. Isso é pior do que qualquer raid0 (uma gravação) ou raid1 (duas gravações)

Capitão Segfault

0

A teoria da probabilidade diz que P1 é a probabilidade de falha do dispositivo 1 e P2 - para o dispositivo 2, a falha de qualquer um deles ocorre com uma chance de P1 + P2. Isso significa que as chances de perda de dados são realmente maiores, na verdade - duas vezes mais.

Na prática, tenho o RAID 0 e não falha: os HDDs têm 1 a 2 anos de estabilidade garantidos e geralmente funcionam bem durante esse período. Você pode monitorar seus parâmetros SMART para garantir que a matriz não falhe imprevisivelmente.

Acredito que hoje em dia os discos rígidos são a parte mais lenta do computador. Ao usar o RAID 0, percebi que tudo funciona MUITO mais rápido e todo o sistema é mais responsivo: carregamento do SO, carregamento suave, etc. Na verdade, agora estou ficando cansado cada vez que preciso tocar em sistemas sem RAID interno :)

No entanto, como Josh disse, você precisa fazer backups. Não apenas ao usar RAIDs;)

Kolypto
fonte

2

Isso não está correto. Se ambos os dispositivos tiverem 50% de chance de falhar dentro de 5 anos, não há 50% + 50% = 100% de chance de um deles falhar dentro de 5 anos.

3129 Amok

Não, está correto. Temos Probabilidade (FAIL-1 ou FAIL-2) aqui, que na verdade é Probabilidade (FAIL-1) + Probabilidade (FAIL-2). Confira: en.wikipedia.org/wiki/Probability#Mathematical_treatment

kolypto (

3

Não, está errado. Leia suas próprias fontes novamente. Não tente incluir a matemática se não prestar atenção.

Zac Thompson

2

"Os HDDs têm 1 a 2 anos de estabilidade garantidos". Se a unidade falhar, você será compensado proporcionalmente pelo tempo restante em sua garantia. Você NÃO será compensado pelos dados que acabou de perder. Além disso, a SMART não impedirá, ou necessariamente avisará, uma falha total e repentina na unidade, como vemos com muita frequência. Por que correr riscos com o componente mais não confiável em um computador?

1

Um exemplo ainda melhor é, digamos, 80%. A probabilidade de falha obviamente não é de 160%. A probabilidade de falha de qualquer unidade é P1 + P2 - P1 x P2, portanto, se ambos fossem 80%, a probabilidade geral seria de 96%. A probabilidade de ambas as unidades falharem é P1 x P2, o que seria de 64% usando este exemplo (portanto, usar duas unidades é uma melhoria - com certeza suas chances de algum tipo de perda de dados aumentam, mas a chance de perda de um determinado dado é reduzida ).

Dennis Williamson

0

O RAID 0 pode ser uma ótima solução em muitos casos em que o tempo de inatividade não é crítico.

O RAID fornece velocidade, redundância ou ambas. O RAID não é uma solução de backup, pois apenas protege contra falhas de hardware, apenas um tipo de falha que pode causar perda de dados. Isso significa que você precisa ter uma solução de backup, independentemente do tipo de RAID usado.

Independentemente do tipo de RAID empregado, você terá um desempenho degradado em caso de falha no disco ou reconstrução do array e, atualmente, os HDs estão ficando cada vez maiores e a velocidade é mais ou menos estagnada - o tempo de reconstrução pode se estender por dias ou até semanas e crie estresse desnecessário nos discos.

Pessoalmente, prefiro executar o RAID 0 que, em caso de falha no disco, será restaurado a partir do backup. Essa é para mim a solução mais rápida, barata e menos estressante, pois um pouco de inatividade não é realmente uma preocupação.

Lembre-se, quando você está reconstruindo uma matriz, todos os blocos de dados estão sendo lidos / gravados em todos os discos, independentemente da quantidade de dados úteis nos discos. Na prática, isso geralmente se traduz em dados muito mais rápidos reconstruídos do backup em comparação com uma reconstrução do RAID após uma falha no disco. Combinado com significativamente menos ciclos de gravação / leitura na operação normal do RAID 0 em comparação com o RAID 1/10 ou RAID 5/6, ele se traduz em menos falhas de disco no geral.

Tudo acima é verdadeiro se você tiver uma boa estratégia de backup automático, por exemplo:

backup contínuo em arquivos quentes
backups diários em arquivos frios (ish)
backups semanais em todos os arquivos da mídia localizada remotamente.

Para minimizar o tempo de inatividade, mesmo ao usar o RAID 0, é possível classificar o backup de dados quentes em mídias rápidas como SSD externo, pois o conjunto de dados quentes geralmente é pequeno e os SSDs externos são muito baratos atualmente e backup de dados frios em mídias lentas. A maioria dos sistemas NAS comerciais, com exceção dos mais baratos, poderá fazer isso por você hoje em dia sem muito aborrecimento.

Em sistemas de missão crítica, tudo isso é irrelevante, pois o tempo de inatividade não é realmente uma opção, mas mesmo assim ainda existem soluções melhores - como replicação de instantâneos no ZFS, brtfs ou codificação de apagamento ou redundância de servidor com sistemas de failover em vigor.

Marius P
fonte

O RAID 0 é tão arriscado quanto as pessoas dizem?

Respostas: