RAID (Redundant Array of Independent Disks) combina vários discos rígidos baratos em uma configuração que fornece desempenho, capacidade de armazenamento e segurança maiores do que um único disco rígido. Existem diferentes níveis de RAID, incluindo RAID 0 para desempenho, RAID 1 para espelhamento e segurança, e RAID 5 para alta performance de leitura com redundância.
Multi-core Parallelization in Clojure - a Case Study
RAID em 40
1. RAID - Redundant Array of Independent Disks (Conjunto Reduntante de Discos Independentes ) Cursos: Sistemas de Informação / Processamento de Dados Tópico 26 e 27
2. O Sistema RAID consiste em um conjunto de dois ou mais discos rígidos com dois objetivos básicos: Velocidade: tornar o sistema de disco mais rápido, acelerando o carregamento de dados do disco através de uma técnica chamada divisão de dados (data stripping ou RAID 0); Segurança: Tornar o sistema de disco mais seguro, através de uma técnica chamada espelhamento (mirroring ou RAID 1). Estas técnicas podem ser usadas isoladamente ou em conjunto. Essas duas técnicas podem ser usadas isoladamente ou em conjunto.
3. RAID ,combina múltiplos discos de baixo custo em uma disposição que obtém desempenho , capacidade de armazenamento e segurança que superem um único discorígido. Para o servidor, ou máquina em que o dispositivo será instalado, a combinação de discos serátransparente, ou seja, aparecerá como uma única unidade lógica. O tempo médio entre falhas ( MeanTime BetweenFailure-MTBF ) de uma disposição de discos é igual ao MTBF de um disco individual, dividido pelo número de discos na disposição. Por esse motivo, o MTBF de uma disposição sem redundância (RAID 0) é muito baixo para um sistema de missão crítica. De qualquer forma, disposições de disco podem ser feitos com tolerância a falha através do armazenamento redundante de informações de várias maneiras. Foram definidos inicialmente cinco tipos de arquiteturas de disposição de discos, RAID 1 até RAID 5, cada qual com tolerância a falhas porém com diferentes propostas de características e desempenho. A arquitetura não redundante , tornou-se comum referir-se como RAID 0.
4. Na técnica de divisão de dados, dois discos rígidos dispostos em uma máquina farão parte de um mesmo conjunto, fazendo com que o micro "pense" que os dois discos rígidos fazem parte de um só disco maior. Se os dois discos são de 40 GB, então o micro "pensará" que existe um disco rígido único de 80 GB instalado no micro. Ao gravar um arquivo no disco, o sistema RAID irá dividir esse arquivo entre os dois discos rígidos, podendo gravar metade do arquivo em um disco e a outra metade do arquivo no outro disco. Tudo isso é feito sem que o usuário perceba. Essencial para a tecnologia de RAID, é a combinação de vários discos em apenas uma única unidade lógica de armazenamento. STRIPING (“Divisão de dados”)
5. Vamos supor que você esteja gravando um arquivo de 200 KB. Usando o sistema de disco tradicional: esse arquivo terá de ser gravado por inteiro em um só disco, usando o único canal de comunicação existente. Na divisão de dados: esse arquivo será dividido em dois arquivos de 100 KB, sendo que cada um será gravado em um dos discos existentes ao mesmo tempo. Como um arquivo de 100 KB demora a metade do tempo para ser gravado em um disco que um arquivo de 200 KB, a velocidade de acesso ao disco rígido dobra Divisão de dados: vantagens
6. RAID 0 RAID 0 – Performance sem tolerância a falhas. O uso de RAID 0 é mais indicado quando custo e performance são críticos e a integridade de dados pode ser colocada de lado.
7. É definido como um grupo de discos em faixa (striping): Sem paridade ou redundância de dados; A desvantagem é que o RAID 0 não é tolerante a falhas, ou seja, caso um disco falhe, todo o sistema de armazenamento falhará. Leitura e Escrita de dados podem ocorrer simultaneamente. Oferece a melhor eficiência e desempenho no armazenamento de dados que qualquer outro tipo de disposição: O acesso aos discos tanto para escrita quanto leitura dos dados será feito em paralelo, garantindo desempenho
8. RAID 1 O RAID 1 oferece a melhor performance de qualquer tipo de disposição redundante. As operações de escrita de dados irá para ambos os discos do par espelhado. As operações de leitura podem acontecer simultaneamente em todos os discos. Cada disco pode apresentar simultâneas ou independentes operações de leitura.
9. Configuração conhecida como espelhamento (mirroring) . É simplesmente um par de discos que armazenam duplicadamente os dados, porém aparece para o sistema como apenas um disco. Supondo-se dois discos de 40 GB cada. Para o sistema, existirá apenas uma unidade com 40 GB, pois, os dados estarão sendo duplicados (espelhados) no segundo disco, e por esse motivo passa-se a ter tolerância a falhas, pois se um disco falhar o conjunto continua em operação e, se os discos suportarem a tecnologia de hot-swap,o disco defeituoso poderá ser substituído e o sistema fará o sincronismo sem a necessidade de parada do equipamento. A técnica de striping não é usada em um único par de discos espelhados, múltiplas configurações de RAID 1 podem receber uma configuração de striping formando, juntos, um grande dispositivo de armazenamento único porém com a devida redundância oferecida pelo RAID 1 . O espelhamento dobra o desempenho de leitura em relação a um disco não espelhado enquanto que o desempenho de escrita se mantém a mesma.
10. RAID 5 Alta performance de leitura e boa performance de escrita Operações de escrita necessitam atualizar a paridade. As operações de leitura podem acontecer simultaneamente.
11. Algumas vezes chamado de disposição de rotação de paridade ( Rotating Rotating Parity Parity Array Array ), evita o gargalo de escrita comum em disco de paridade dedicado. No RAID 5, as informações de paridade são distribuídos entre os discos. A partir do momento que não há disco de paridade dedicado, todos os discos contêm informações de paridade e dados e as operações de leitura podem ser sobrepostas em todos os discos da disposição. As operações de escrita irão acessar tipicamente um disco de dados e um disco de paridade. No entanto, pelo fato de diferentes dados armazenarem as suas informações de paridade em diferentes discos, as operações de escrita também podem ser sobrepostas.
12. RAID 0+1 A divisão de dados e o espelhamento podem ser combinados ao mesmo tempo, dos níveis 0 (Striping) e 1 (Mirroring), em uma configuração normalmente chamada RAID 0+1.
13. A divisão de dados será usada em dois discos para aumentar a velocidade, enquanto que os outros dois discos serão backup dos dois primeiros. Se um dos discos falhar, o sistema começa agir como um sistema RAID 0. Computadores modernos permitem o uso do RAID 0+1 usando apenas dois discos rígidos. Essa configuração é chamada JBOD (Just a Bunch of Disk) e funciona usando apenas metade da capacidade de cada disco, simulando assim quatro discos rígidos. Por exemplo: Usando dois discos rígidos de 40 GB com configuração RAID JBOD, a capacidade total disponível será 20 GB (os outros 20 GB serão usados para fazer o backup dos dados da primeira metade do disco).
14. RAID 2 Tem-se dois conjuntos lógicos: - Armazenando dados; - Armazenando informação ECC (Error Correcting Code–Código de Correção de Erros) Apenas o conjunto que armazena os dados será visível para o usuário.
15. RAID 3 Cada operação de leitura e escrita envolve todos os discos. O acesso paralelo diminui o tempo de transferência para longos dados seqüenciais. Armazenamento de informações de paridade Esta configuração necessita de no mínimo 3 discos e um número ímpar de discos.
16. RAID 4 Toda operação de escrita deve ser atualizada no disco de paridade dedicado. As operações de leitura podem ocorrer simultaneamente em todos os discos. No entanto, toda operação de escrita deve ser atualizada no disco de paridade, elas não podem ser sobrepostas. Utiliza large stripe (largas faixas), os dados podem ser lidos de um disco individual da disposição (exceto o disco de paridade). Isto permite que operações de leitura sejam sobrepostas.
17. RAID 6 Utiliza simultaneamente dois esquemas de paridade. A vantagem é que obtém-se um sistema amplamente tolerante a falhas, porém paga-se um preço alto na performance de escrita, já que existe uma quantidade maior de informações de paridade que deve ser escrita.