Um guia para a tecnologia de armazenamento RAID

Seção 1

Visão geral do RAID

O que é RAID?

A matriz redundante de discos independentes (RAID) é uma tecnologia de armazenamento que combina vários discos rígidos físicos para criar uma unidade lógica com melhor desempenho e confiabilidade do que as unidades individuais. Aumenta a velocidade de armazenamento e acesso a dados, evitando perda de dados e tempo de inatividade.

A tecnologia RAID, originalmente conhecida como matriz redundante de discos baratos, foi desenvolvida por Randy Katz, David Patterson e Garth Gibson e em 1987. Os três cientistas da Universidade da Califórnia, Berkeley, estavam tentando enfrentar os desafios que frequentemente resultavam em dados perdas. Hoje, sua criação – que foi aprimorada e aprimorada – permite organizar dados em vários discos e reconstruir as informações ausentes no caso de uma falha de hardware de um ou mais discos..

Embora tradicionalmente projetado para servidores, o RAID também é usado em estações de trabalho, computadores com armazenamento intensivo e outros aplicativos que exigem segurança de dados, altas velocidades de transferência e grandes capacidades de armazenamento. Aplicações típicas nas quais operações rápidas de leitura e gravação de arquivos grandes são importantes incluem edição de vídeo, CAD, design gráfico etc..

Uma configuração RAID alcança um ou uma combinação dos seguintes benefícios.

Melhorando o desempenho de leitura / gravação de dados, proporcionando transferências mais rápidas.

Replicar dados em dois ou mais discos para aumentar a redundância e impedir a perda de dados em caso de falha no disco.

Combinando várias unidades de disco para fornecer uma capacidade maior.

Como funciona o RAID?

O RAID é uma tecnologia para configurar e suportar várias combinações de discos rígidos físicos, com o objetivo de melhorar a confiabilidade, desempenho e capacidade. Consiste em vários discos físicos e um controlador para configurá-los e gerenciá-los.

Existem diferentes esquemas de RAID para espalhar ou replicar dados em diferentes discos membros. Cada uma das configurações fornece um equilíbrio exclusivo entre capacidade, desempenho e resiliência. Geralmente, os três conceitos principais são striping, espelhamento e paridade. Cada um deles tem seus méritos e limitações, mas pode ser combinado para um melhor desempenho.

A distribuição distribui os dados uniformemente por vários discos físicos, o espelhamento replica os dados em dois ou mais discos, enquanto a paridade usa dados brutos para calcular e armazenar informações de paridade para correção de erros. Ao gravar ou acessar informações simultaneamente na distribuição, o RAID melhora o desempenho, enquanto o espelhamento permite que os dados sejam acessados ​​a partir de boas unidades restantes no caso de uma falha no disco.

Quando devo usar o RAID

O RAID é ideal para aplicativos de alta confiabilidade e aqueles que exigem armazenamento maior ou altas velocidades de transferência de dados. Todos os sites e aplicativos críticos online e offline devem usar o RAID para melhorar o desempenho, impedir a perda de dados ou o tempo de inatividade.

A maioria dos servidores modernos utiliza unidades SSD rápidas, portanto, pode não exigir mais melhorias de desempenho. No entanto, é necessário adicionar redundância para garantir a confiabilidade e a disponibilidade do site em caso de falha no disco. Para servidores que usam drives lentos antigos, pode ser necessário usar um nível RAID que combine melhoria de desempenho e redundância de dados. Para ler mais sobre HDD e SSD, leia o nosso guia de hospedagem SSD vs. HDD.

Quase todos os servidores físicos em hospedagem compartilhada, VPS ou servidores dedicados têm unidades de disco que operam em uma configuração RAID. Geralmente, pelo menos uma das unidades é configurada para paridade e todos os dados copiados aqui têm um bit extra que ajuda na recuperação de dados em caso de falha em um dos discos.

O RAID em servidores dedicados, VPS ou compartilhados aumenta o desempenho do servidor e a redundância de dados. No entanto, não elimina a necessidade de backup de dados externo, apenas no caso de um ataque de vírus ou desastre.

Geralmente, a maioria dos provedores usa o RAID para os servidores e os sistemas de backup. Isso aumenta o nível de proteção de dados e a velocidade de recuperação de dados, caso ocorra algum problema com os discos no servidor ou no armazenamento de backup.

Embora o RAID tenha sido projetado inicialmente para servidores, indivíduos e usuários com muitos dados, como editores de vídeo e áudio, podem usá-lo para melhorar as operações de leitura e gravação.

Usando RAID com um controlador RAID

Um controlador RAID é um dispositivo de hardware ou driver de software para configurar e gerenciar discos rígidos em uma matriz. Ele fornece uma interface para combinar os discos físicos e apresentá-los ao sistema operacional como uma única unidade lógica.

Um controlador RAID de hardware é um dispositivo físico integrado na placa-mãe ou disponível como uma placa de extensão PCI ou PCI Express complementar. Para RAID de hardware, o controlador executa tudo e possui sua CPU e memória. Os controladores são projetados para suportar interfaces específicas do disco rígido e níveis de invasão. Por exemplo, existem controladores exclusivos para unidades SCSI, SATA, SAS ou SSD e não são intercambiáveis.

Alguns controladores de hardware têm um cache adicional para evitar perda de dados em caso de falta de energia, além de aumentar as operações de leitura e gravação. As vantagens de um ataque de hardware são o melhor desempenho, dando suporte à inicialização a partir da matriz e fornecendo uma melhor abstração. No entanto, eles são mais caros e há riscos de bloqueio do fornecedor, pois a maioria deles usa firmware proprietário.

Um RAID baseado em software usa o sistema operacional e o hardware existente, como a CPU do computador e os controladores SAS, IDE ou SATA padrão. Isso é mais flexível, menos dispendioso e está disponível na maioria dos sistemas operacionais para servidores e desktops. No entanto, a instalação geralmente está vinculada a um sistema operacional específico e pode não ser compatível com outros tipos. Como ele usa a capacidade de processamento e a memória do computador, isso pode prejudicar o desempenho do servidor. Outras limitações incluem incapacidade de inicializar a partir da matriz RAID e falta de suporte para troca a quente, a menos que seja utilizado um controlador de hardware compatível.

Seção 2

Níveis de invasão

O que são níveis de RAID?

Um nível RAID refere-se à técnica de distribuição, organização e gerenciamento de dados em vários discos em uma matriz. Cada nível possui propriedades diferentes de tolerância a falhas, redundância de dados e desempenho, e a escolha depende dos requisitos ou objetivos, bem como do custo. Alguns níveis oferecem mais proteção de dados, enquanto outros oferecem melhor melhoria de desempenho do que outros métodos.

Geralmente, todas as matrizes RAID são classificadas como níveis padrão, não padrão ou aninhados, dependendo da configuração e do tipo e nível de aprimoramentos oferecidos.

Os níveis padrão de RAID contam com configurações básicas e simples. Isso inclui os níveis originais, um a cinco, mais dois outros (0 e 6) que foram adicionados posteriormente. Outros níveis além desses são definidos como não padrão. No entanto, o nível 0 às vezes não é considerado como RAID, pois não oferece redundância.

Um RAID aninhado ou híbrido combina um nível RAID padrão que fornece redundância com um RAID 0 para melhorar o desempenho da transferência de dados. Esse nível requer mais drivers, controladores de hardware de alta qualidade e computadores mais potentes. Alguns controladores e drivers de software de baixo custo não suportam RAID aninhado. Isso torna a implementação mais cara e geralmente ideal para grandes empresas e empresas.

Níveis de RAID não padrão são aqueles que não dependem de arquiteturas ou métodos básicos usados ​​nos níveis de RAID tradicionais. Alguns deles são proprietários e usados ​​apenas para determinadas aplicações. Eles fornecem níveis mais altos de desempenho e geralmente são adequados para aplicações específicas.

Níveis padrão de RAID

Os níveis padrão de RAID são baseados em configurações simples e básicas de hardware e são ideais para uma ampla gama de empresas e indivíduos. O nível padrão típico é RAID 0, 1, 2,3,4,5 e 6. Cada um desses fornece uma combinação única de redundância e desempenho.

Embora os níveis 1, 5 e 6 forneçam algum grau de tolerância a falhas, o nível 0 não oferece o desempenho mais rápido. O RAID 1 é o mais confiável em segurança de dados, enquanto o nível 5 oferece o melhor equilíbrio entre desempenho, tolerância a falhas e confiabilidade.

RAID 0

Um nível RAID 0 usa strip-blocking para espalhar dados por vários discos físicos. Ele tem o desempenho de E / S mais rápido, pois grava ou copia pequenas partes diferentes de um arquivo em – ou de – vários discos simultaneamente.

Requer um mínimo de duas unidades físicas e fornece o espaço máximo em disco, que é o total das capacidades individuais do dispositivo. No entanto, ele não oferece redundância de dados ou tolerância a falhas e é melhor para organizações que procuram desempenho. Uma falha em qualquer um dos discos em uma matriz RAID 0 resulta em completa perda de dados, incluindo dados salvos nas boas unidades.

O nível RAID 0 é melhor para aplicativos que processam dados não críticos, mas requer alto desempenho.

Diagrama de uma configuração RAID 0

RAID 1

O RAID 1 espelha os dados em dois ou mais discos sem paridade. O nível requer pelo menos duas unidades e o espaço útil total é igual ao tamanho de um único disco.

Todos os discos têm cópias idênticas de dados. Em caso de falha no disco, o sistema continua a usar o disco ou discos existentes em boas condições de funcionamento.

O nível RAID 1 fornece melhor redundância de dados e é ideal para aplicativos em que a disponibilidade de dados é crítica. Esta é uma tecnologia simples com tolerância básica a falhas, mas sem melhorias de desempenho, pois deve gravar os dados duas vezes.

Isso é ideal para aplicativos em que a disponibilidade e a redundância de dados são importantes.

Diagrama de uma configuração RAID 1

RAID 2

O RAID 2 usa a distribuição no nível de bit com paridade em comparação com a distribuição no bloco no RAID 0. Além disso, ele usa o código Hamming para detecção de erros e, portanto, requer discos sem a opção de verificação de erros no disco. Como a maioria dos discos modernos possui esse recurso, o nível raramente é usado. Além disso, requer um disco extra para armazenar informações de paridade para fins de detecção de erros. A capacidade efetiva do disco é n-1, em que n é o número de discos.

O RAID 2 funciona como o RAID 0, mas usa a distribuição no nível de bit junto com um mecanismo de proteção contra erros para proteger a perda de dados devido à corrupção. Esse recurso é extenso e não é amplamente utilizado.

Diagrama de uma configuração RAID 2

RAID 3

O RAID 3 usa distribuição no nível de bytes com paridade para reconstruir dados. Requer um mínimo de três unidades, das quais uma armazena as informações de paridade. O nível possui taxas de transferência de dados de alto nível para arquivos grandes, pois os dados são acessados ​​em paralelo, mas mais lentamente em arquivos pequenos.

Esse nível tem um desempenho melhor para longas transferências de dados seqüenciais, como vídeo, mas não em aplicativos em que existem muitas solicitações, como um banco de dados. No caso de o disco com paridade travar, não há como reconstruir dados. O nível não é muito usado e, assim como o RAID 2, sua capacidade utilizável é n-1.

Diagrama de uma configuração RAID 3

RAID 4

O RAID 4 é quase semelhante ao RAID 3, mas usa distribuição no nível de bloco. Ele combina a distribuição em nível de bloco em vários discos com um disco de paridade dedicado. O nível requer um mínimo de três discos, onde um é reservado para informações de paridade. Os dados de cada unidade são acessados ​​independentemente em apenas um bloco de cada vez, portanto, operações lentas. Além disso, as operações de gravação são mais lentas, pois o sistema deve gravar as informações de paridade.

Isso é ideal para acesso sequencial a dados. No entanto, o disco de paridade pode retardar os aplicativos de gravação. O nível é raramente usado.

Diagrama de uma configuração RAID 4

RAID 5

O RAID 5 possui distribuição de nível de bloco junto com paridade distribuída. Essa é uma configuração completa e econômica, que equilibra entre redundância, desempenho e capacidade de armazenamento.

A distribuição melhora o desempenho de E / S de leitura, enquanto a paridade é importante para reconstruir os dados em caso de falha no disco. No entanto, ele não pode sobreviver a várias falhas de disco e leva mais tempo para reconstruir dados, pois o processo envolve o cálculo da paridade de cada uma das unidades disponíveis. Requer um mínimo de três discos, mas possui um espaço útil de disco n-1.

O nível RAID 5 é adequado para aplicativos e servidores de arquivos com dispositivos de armazenamento limitados.

Diagrama de uma configuração RAID 5

RAID 6

O RAID 6 usa distribuição de bloco como o RAID 5, mas com uma paridade distribuída dupla. Os dois blocos de informações de paridade fornecem redundância e tolerância a falhas adicionais. Este nível pode sobreviver a duas falhas de disco simultâneas. No entanto, é caro; requerendo pelo menos quatro unidades e ao mesmo tempo fornecer um espaço utilizável, são n-2 discos.

É mais confiável e comum em ambientes e aplicativos SATA, como backups em disco e arquivos de dados, onde há necessidade de retenção prolongada de dados. Também é adequado para ambientes onde a disponibilidade de dados é mais importante que o desempenho.

As desvantagens do nível 6 incluem o disco adicional para as informações de dupla paridade, além de serem complexas de implementar em comparação ao nível 5. Devido à dupla paridade, as velocidades de gravação e restauração são mais lentas.

Diagrama de uma instalação RAID 6

Níveis RAID aninhados (híbridos)

Um RAID aninhado é uma combinação de um nível que fornece redundância e um RAID 0 que aumenta o desempenho. Isso pode usar matrizes RAID ou discos individuais. Geralmente, a melhor combinação é ter o RAID 0 no topo de uma matriz redundante, pois menos discos precisarão ser regenerados em caso de falha no disco.

Os níveis aninhados fornecem melhor desempenho e maior tolerância. No entanto, eles exigem configurações complexas e mais unidades, enquanto a capacidade efetiva reduz pela metade o espaço em disco instalado. Eles também são caros e têm escalabilidade limitada.

Os níveis comuns incluem 0 + 1, 1 + 0 (10), 0 + 3, 3 + 0 (30), 0 + 5, 5 + 0 (50) e 6 + 0 (60)

RAID 0 + 1

O RAID 0 + 1 combina o RAID 0 e 1 para fornecer redundância e melhorar o desempenho. O processo começa distribuindo os dados por vários discos, o que aumenta o desempenho, seguido pelo espelhamento para redundância de dados.

O RAID 0 + 1 requer um mínimo de quatro discos rígidos físicos e é uma configuração complexa que fornece alto desempenho e tolerância a falhas. Ele pode sobreviver a mais de uma falha de disco no mesmo conjunto espelhado, desde que não haja falha simultânea de dois discos espelhados.

Esse nível requer discos em múltiplos de dois, mas a capacidade útil total é geralmente metade do espaço total em disco. Além disso, é mais caro e não é facilmente escalável.

Uma configuração RAID 01 aninhada

Configuração RAID 01 aninhada

Uma configuração híbrida RAID 01

Configuração RAID 01 híbrida

INCURSÃO 1 + 0

O RAID 1 + 0 ou RAID 10 inicia com o espelhamento de dados antes de distribuí-lo pelas matrizes espelhadas. A abordagem o torna mais redundante, confiável e eficiente que o RAID 0 + 1 e pode sobreviver a várias falhas de unidade. Requer um mínimo de quatro unidades e pode sobreviver a várias falhas simultâneas de disco, desde que nenhum dos espelhos perca todos os discos..

O RAID 1 + 0 possui melhor tolerância a falhas, redundância e reconstrução de dados em comparação com o RAID 0 + 1. No entanto, é muito caro e, assim como o 0 + 1, tem escalabilidade limitada. O nível é ideal para organizações que buscam alto desempenho e segurança de dados. A capacidade utilizável é metade do espaço total em disco instalado.

Diagrama de uma instalação RAID 1 + 0

RAID 0 + 3

Isso também é conhecido como RAID 53 e consiste em uma matriz Raid 0 dividida em uma matriz RAID 3. Além disso, ele possui uma matriz de paridade dedicada distribuída por discos.

O nível possui altas taxas de transferência de dados e tolerância a falhas oferecidas pelos segmentos RAID 3. Esse nível fornece alta tolerância e possui excelente desempenho com leituras e gravações seqüenciais e aleatórias. No entanto, é mais complexo e caro, pois requer mais unidades.

Infelizmente, o nível é caro e requer discos com eixos que devem ser sincronizados juntos. Isso pode limitar a escolha dos discos a serem usados.

Diagrama de uma configuração RAID 0 + 3

RAID 5 + 0

O RAID 5 +0 ou o RAID 50 combina a paridade distribuída do RAID 5 com a distribuição do RAID 0. Consiste em duas ou mais matrizes RAID 5 nas quais os dados e informações de paridade nas matrizes são distribuídos pelos discos. Exigindo um mínimo de seis discos físicos, ele melhorou a proteção de dados, o desempenho de gravação e as reconstruções mais rápidas em comparação com o RAID 5. É, portanto, ideal para aplicativos em que a alta disponibilidade é importante.

Uma falha de unidade única afetará apenas essa matriz e não prejudicará o desempenho, como acontece no RAID 5. Além disso, ele pode suportar até quatro falhas de unidade, desde que cada uma esteja em uma matriz RAID 5 diferente. No entanto, requer um controlador RAID sofisticado.

Diagrama de uma configuração RAID 0 + 5

JBOD RAID N + N

O JBOD (apenas um monte de discos) combina vários discos que representa para o sistema operacional como uma única unidade com maior capacidade, mas sem redundância. Diferente de outros níveis de RAID, esse arranjo permite acessar unidades individuais separadamente. Este não é realmente um nível RAID, mas simplesmente um arranjo.

O JBOD consiste em vários discos padrão que podem ter tamanhos diferentes. A capacidade total é a soma dos discos individuais e pode ser aumentada com a adição de uma unidade extra. Assim como o RAID 0, ele oferece o melhor desempenho, pois também não possui paridade que aumentaria a sobrecarga. No entanto, ele não possui proteção de dados e cada disco é um ponto potencial de falha. Portanto, é ideal para aplicativos intensivos de E / S e para aqueles que exigem maior armazenamento.

Diagrama de uma instalação do disco JBOD

Níveis de RAID não padrão

Os níveis de RAID não padrão dependem de arquiteturas ou algoritmos diferentes dos de um RAID padrão. Alguns são baseados em sistemas de código aberto, enquanto outros dependem de tecnologias proprietárias e oferecidos apenas por determinados fornecedores para aplicativos específicos.

Aqueles que usam hardware e software proprietários e podem não ser compatíveis com outros sistemas de diferentes fabricantes. Os exemplos incluem o RAID-3D da Pure Storage e o XtremIO Data Protection (XDP) da Dell EMC.

Níveis de RAID não padrão oferecem melhor desempenho e tolerância a falhas do que os níveis padrão. Eles são usados ​​para aplicativos especializados que exigem mais disponibilidade e confiabilidade do que o nível padrão pode oferecer.

RAID 3D

Este é um RAID proprietário desenvolvido pela Pure Storage e usa unidades flash em vez de discos rígidos. Isso geralmente é usado para evitar a perda de dados em caso de falha do componente no armazenamento flash. Devido às velocidades de transferência mais rápidas em unidades de estado sólido, o array tem um alto desempenho de E / S. Se o RAID 3d detectar uma falha do dispositivo que muitas vezes causa atrasos de E / S, ele reconstruirá os dados dos outros dispositivos no mesmo grupo de paridade.

RAID 1E aprimorado

O RAID 1 aprimorado (RAID 1E) combina dados de espelhamento e distribuição em vários discos. É quase semelhante ao RAID 1, mas possui distribuição e requer um número ímpar de discos, dos quais o mínimo é 3 unidades. O RAID 1E aprimorado espelha a faixa completa de dados para uma faixa diferente dentro do conjunto de discos e às vezes é chamado de faixa espelhada. Devido ao espelhamento, esse nível possui uma boa redundância de dados.

Diagrama de uma instalação RAID 1E

RAID 5 E aprimorado

O RAID 5 E é uma variante do RAID 5, mas com uma unidade hot spare adicional. O hot spare geralmente está ativo, aguardando a falha de outra unidade. Quando ocorre uma falha, o hot spare fica disponível para a reconstrução de dados. O RAID 5E requer no mínimo quatro discos e tem um desempenho melhor que o RAID 5. tradicional. No entanto, não é possível compartilhar a unidade sobressalente entre matrizes. Além disso, sofre reconstruções lentas.

Diagrama de uma instalação RAID 5E

Seção 3

Prós e contras do RAID

Benefícios do uso de RAID

Os benefícios de um sistema RAID variam de acordo com o nível. Uma matriz pode aumentar o desempenho, resiliência ou redundância de dados, mas o nível de melhoria varia de acordo com o tipo de configuração e o número de discos. Geralmente, uma matriz fornece um ou mais benefícios, mas nem todos os máximos ao mesmo tempo.

  • Impedindo a perda de dados em caso de falha no disco: Um RAID com redundância de dados fornece melhor continuidade das operações de negócios. Nesse sistema, uma falha no disco não interfere nos aplicativos ou no acesso aos dados, pois o servidor utilizará os restantes discos válidos. Além disso, a substituição de um disco defeituoso em matrizes RAID de troca dinâmica não requer o desligamento ou a interrupção das operações. Mais discos fornecem um melhor nível de tolerância a falhas.
  • Melhorando a velocidade de leitura / gravação daí o desempenho dos servidores ou computador, como estações de trabalho para edição de vídeo e outros aplicativos com uso intenso de dados. No entanto, isso dependerá do nível RAID e do número de unidades físicas.
  • Aumentando a capacidade de armazenamento usando discos simples e mais baratos: Isso é mais econômico do que comprar uma unidade única grande.
  • Aumentando a tolerância a falhas através do uso de vários discos.

Custos reduzidos e confiabilidade aprimorada: Ao usar vários discos menores e mais baratos, a matriz permite aumentar a capacidade a um custo menor do que adquirir uma única unidade de alta capacidade.

Desvantagens do uso de RAID

Embora existam diferentes níveis de RAID para atender a várias necessidades de armazenamento de dados, a tecnologia está vulnerável a várias falhas que podem resultar em perda de dados ou inatividade. As desvantagens incluem:

  • Como as unidades RAID geralmente estão dentro de um servidor no mesmo data center, um desastre pode danificar as unidades ou toda a matriz, destruindo potencialmente todos os dados. Outros sistemas, como o CDP, armazenam os dados em unidades remotas, adicionando uma camada de proteção extra em caso de desastre..
  • O armazenamento RAID contém a versão atual dos dados, o que garante uma reconstrução mais fácil em caso de falha. No entanto, não é possível recuperar uma versão mais antiga do arquivo, especialmente se houver um ataque de vírus, alteração incorreta de arquivos ou edições maliciosas.
  • Com capacidades de unidade maiores, o RAID sofre longos períodos de reconstrução sempre que um ou mais discos falham. Leva mais tempo para reconstruir um volume RAID quando ocorre uma falha e, no caso de outros discos falharem antes que a reconstrução seja concluída, todos os dados serão irrecuperáveis. Isso também aumentará o tempo de inatividade.
  • A implementação de uma matriz RAID é cara, pois requer vários discos. Para o RAID que oferece redundância, não é possível usar a capacidade total. O espaço utilizável geralmente é menor que a capacidade instalada total.
  • Complexo e intransferível. Embora as caixas controladas por hardware ou RAID sejam transferíveis, as matrizes RAID baseadas em software não são.
  • Requer habilidades de TI e familiaridade com as tecnologias. Dessa forma, as organizações podem exigir gastar mais dinheiro para treinar sua equipe ou contratar prestadores de serviços de terceiros, especialmente para reconstruir dados ou solucionar problemas de funcionamento..

Conclusão

O RAID continuará oferecendo benefícios de desempenho e proteção de dados por vários anos. No entanto, exige novas estratégias para torná-lo mais eficaz e compatível com as tecnologias e necessidades emergentes. Atualmente, existem requisitos críticos de armazenamento que estão além das tecnologias RAID existentes.

Alguns fabricantes já estão usando novas abordagens para atender às necessidades crescentes e variáveis ​​e também abordam as modernas tecnologias e limitações de disco. Por exemplo, em vez de usar o RAID 0 para melhorar o desempenho, os sistemas modernos podem utilizar DRAM, caches flash, classificação automatizada por níveis de armazenamento (AST) e outras tecnologias, como distribuição ampla.

Os discos de hoje, como SSDs, são maiores e rápidos. Isso elimina a necessidade de distribuir dados para melhorar o desempenho. No entanto, unidades maiores têm o desafio de tempos de reconstrução mais longos, que podem variar de 4 horas a vários dias para um disco rígido de 2 TB.

Assim, as organizações que lidam com grandes quantidades de dados, como na escala de petabytes, exigirão estratégias diferentes. Eles devem ter como objetivo tornar o RAID mais eficaz, permitindo competir com as alternativas existentes e futuras, como codificação de apagamento e proteção contínua de dados (CDP).

A codificação de apagamento começa dividindo os dados em fragmentos; em seguida, os expande e codifica com dados redundantes. Estes são armazenados em diferentes mídias e locais de armazenamento. A tecnologia tem poucas despesas gerais em comparação com o RAID tradicional. Requer menos tempo e despesas gerais para reconstruir os dados. No entanto, é intensivo em processador e possui maior latência em comparação com o RAID.

No futuro, uma abordagem é manter a proteção de dados fornecida por um armazenamento físico baseado em RAID e depois virtualizá-la. Esse arranjo criará um volume virtual que não depende da configuração de hardware específica. A replicação desses volumes em locais diferentes diminui o risco potencial de uma falha completa em caso de desastre ou outra falha crítica.

Jeffrey Wilson Administrator
Sorry! The Author has not filled his profile.
follow me